|
むすこの小学校で、週に一度読書の時間があるそうです。
1年生の頃からずっとありましたが、ディスレクシアであるむすこには大変酷な時間であっただろうと思います。
そこで、本は読めなくても聞くことは出来ていますので、自分でオーディオブックのようなものを作ろうと思っています。
方法としては、以下のものでどうか思案中です。
- 本をテキストデータにし、音声合成で聞かせる。(父の声じゃないので気楽に聞ける)
- ぼくが本を読んで、ボイスレコーダーに録音して聞かせる。(一番簡単)
- 上記の併用
そんな訳で、今日は最初に本をテキストデータ化するのに使えるOCRアプリを見てみました。
今は、アプリで写真を撮るだけで日本語がかなりの精度で認識できてすごいなと言う事を感じました。
![](https://i2.wp.com/megane-blog.tokyo/wp-content/uploads/2020/02/audiobook-3106985_1920.jpg?fit=800%2C533&ssl=1)
その前にOCRとは
OCRとは「Optical Character Recognition」の略です。
直訳すると「光学式文字認識」となります。
スキャンして、文字を文字データに変換する、方法等があるから、そんな言い方なのでしょう。
でも、今は調べてみるといっぱいありました。
気に入ったものだけ、ご紹介します。
OCRアプリ
一太郎Pad (無料 株式会社ジャストシステム )
2月に出たばかりのアプリです。iOS/Android対応です。
最初にこのアプリをいじってみましたが、これでいいんじゃない?と思い、他のアプリは面倒なのでやめちゃおうと思ったぐらいレベルが高いと思います。
一太郎と書いてありますので、一太郎と連携すると便利なところはあるようですが、テキストを読み込むだけであればそれはそれで優秀なものだと思います。
![](https://www.justsystems.com/shared/img/icon/ogimage-ichitaropad.png)
![](https://i1.wp.com/megane-blog.tokyo/wp-content/uploads/2020/02/IMG_20200228_180913-scaled.jpg?fit=800%2C1067&ssl=1)
![](https://i1.wp.com/megane-blog.tokyo/wp-content/uploads/2020/02/IMG_20200228_102400-scaled.jpg?fit=800%2C600&ssl=1)
脚注も読んじゃってます。
縦書きでここまで行くので認識力はかなりあると思います。
和風アプリがお好きな方、一度お試しいただければと思います。
![](https://is1-ssl.mzstatic.com/image/thumb/Purple114/v4/aa/d8/a6/aad8a68d-e812-779d-58b6-632f96db4635/AppIcon-0-1x_U007emarketing-0-7-0-85-220.png/1200x630wa.png)
Office Lens (無料 Microsoft)
OfficeソフトやPDFにするのに便利なアプリです。
いつも、保育園の壁お知らせなんかをPDFにするの便利だったので使ってました。
PDFをOneDrive(「OneDrive」>「ドキュメント」>「Office Lens」)やOneNoteに転送できます。
取り回しも良いアプリです。
さて、OCRの出来はどうでしょうか?
![](https://i0.wp.com/megane-blog.tokyo/wp-content/uploads/2020/02/2020-02-28.png?resize=571%2C769&ssl=1)
うーん、微妙。。。。
![](https://i1.wp.com/megane-blog.tokyo/wp-content/uploads/2020/02/2020-02-28-3.png?fit=800%2C433&ssl=1)
見開きに画像が配置されるのはとても良いですね。
でも、読み込んだテキストデータが。。。。
OCRが微妙なので、これはPDF作成用に使っていこうと思います。
![](https://is1-ssl.mzstatic.com/image/thumb/Purple116/v4/da/26/fc/da26fcc9-b2c3-58d5-a2a9-894ab4a65e4b/AppIcon-0-1x_U007emarketing-0-7-0-85-220.png/1200x630wa.png)
GoogleドライブのOCRサービス
個人的に一番気に入ったのがこのサービスです。
GoogleドライブでOCRができるなんて全く知りませんでした。
やり方は簡単です。写真で撮った画像ファイルを「Googleドライブ」にアップロードして、「Googleドキュメント」で開くだけです。
こんな便利な機能があったなんて知りませんでした。
![](https://i2.wp.com/megane-blog.tokyo/wp-content/uploads/2020/02/2020-02-28-4.png?fit=800%2C581&ssl=1)
Googleドライブに文字が書いてある画像をアップロードして、
Googleドキュメントで開くだけでテキストデータが完成します。
さて、OCRの出来栄えはどうでしょうか。再び教科書のモチモチの木の最初のページで試してみました。
![](https://i2.wp.com/megane-blog.tokyo/wp-content/uploads/2020/02/2020-02-28-7.png?fit=800%2C399&ssl=1)
![](https://i1.wp.com/megane-blog.tokyo/wp-content/uploads/2020/02/2020-02-28-8.png?fit=800%2C432&ssl=1)
あ。結構いい。
写真撮るだけですし、面倒がなさそうですので。これまでの中で修正が少なそうな感じです。
いまのところ第一候補です。
これで読み込ませたテキストをAmazon PollyやGoogle Cloud Text-to-Speechに読ませればいいだけです。
![](https://i0.wp.com/megane-blog.tokyo/wp-content/uploads/2020/09/AWSAmazonPolly123.png?resize=160%2C90&ssl=1)
![](https://cloud.google.com/_static/cloud/images/social-icon-google-cloud-1200-630.png)
他の方法
ボイスレコーダー+GoogleドキュメントかOffice365の音声認識
今のところ、これが一番の候補です。
GoogleやMSOfficeやAppleの音声合成技術はかなり優秀です。
ボイスレコーダーで録音しながら、音声認識でテキストを作って行く。
そして、親父の声だと頭に本が入ってこないと言われたら、音声合成に読ませる。
そんな感じで作って行こうかなと思っています。
ただ、読むの大変です。。。。
まとめ
このように、児童用で特にむすこが好きそうなオーディオブックはほぼ無いに等しいので、少しでも知識を得てもらえるようにやってみようと思います。
私達夫婦に加えて現在6歳の妹も本は大好きです。
むすこにも本の素晴らしさをわかってもらえればなと考えています。
追記
追記:2020年8月20日
学校でもオーディオブックの持ち込みはだめですし、読み聞かせも親がやってあげてもまともに聞いてくれていないので、もう少し簡単な方法で、NHK for School等既存のもので代用しています。
やはり、プロの話し手のものは良いみたいで、興味深く聞いています。
比較的短いお話から触れさせてあげようと思います。
夏休みの課題図書は長すぎてだめですねー
しかし、なんで読書感想文なんかあるんだろ?
昔からの疑問です。
コメント