PR

OCRや音声認識を使ってむすこにオーディオブックを作ってあげたい。

この記事は約5分で読めます。
記事内に広告が含まれています。
スポンサーリンク

むすこの小学校で、週に一度読書の時間があるそうです。

1年生の頃からずっとありましたが、ディスレクシアであるむすこには大変酷な時間であっただろうと思います。

そこで、本は読めなくても聞くことは出来ていますので、自分でオーディオブックのようなものを作ろうと思っています。

方法としては、以下のものでどうか思案中です。

  • 本をテキストデータにし、音声合成で聞かせる。(父の声じゃないので気楽に聞ける)
  • ぼくが本を読んで、ボイスレコーダーに録音して聞かせる。(一番簡単)
  • 上記の併用

そんな訳で、今日は最初に本をテキストデータ化するのに使えるOCRアプリを見てみました。

今は、アプリで写真を撮るだけで日本語がかなりの精度で認識できてすごいなと言う事を感じました。

スポンサーリンク

その前にOCRとは

OCRとは「Optical Character Recognition」の略です。

直訳すると「光学式文字認識」となります。

スキャンして、文字を文字データに変換する、方法等があるから、そんな言い方なのでしょう。

でも、今は調べてみるといっぱいありました。

気に入ったものだけ、ご紹介します。

スポンサーリンク

OCRアプリ

一太郎Pad (無料  株式会社ジャストシステム )

2月に出たばかりのアプリです。iOS/Android対応です。

最初にこのアプリをいじってみましたが、これでいいんじゃない?と思い、他のアプリは面倒なのでやめちゃおうと思ったぐらいレベルが高いと思います。

一太郎と書いてありますので、一太郎と連携すると便利なところはあるようですが、テキストを読み込むだけであればそれはそれで優秀なものだと思います。

商品トップ | 一太郎Pad - スマホやタブレットと連携 一太郎Pad登場! | ジャストシステム
株式会社ジャストシステム 一太郎Pad - スマートフォン・タブレット専用メモアプリの商品トップページです。
こうやって本(教科書)を読ませて
こんな感じで、メモ欄にテキストが表示されます。
脚注も読んじゃってます。

縦書きでここまで行くので認識力はかなりあると思います。

和風アプリがお好きな方、一度お試しいただければと思います。

‎一太郎Pad
‎カメラ・写真から自動文字おこしで、かんたんメモ作成!キー入力でのメモ作成も省入力ツールでスムーズに。シンプルな操作で、時短入力が特長のメモアプリです。■こんな使い方がオススメ・いつでも、どこでも、思いついたらすぐにメモ。・紙の文書をテキス...
一太郎Pad - Apps on Google Play
Easy memo creation with camera & saving input

Office Lens (無料 Microsoft)

OfficeソフトやPDFにするのに便利なアプリです。

いつも、保育園の壁お知らせなんかをPDFにするの便利だったので使ってました。

PDFをOneDrive(「OneDrive」>「ドキュメント」>「Office Lens」)やOneNoteに転送できます。

取り回しも良いアプリです。

さて、OCRの出来はどうでしょうか?

OneNoteに転送した画像からテキストを抽出してみました。
うーん、微妙。。。。
Wordに転送した画像とテキストデータ
見開きに画像が配置されるのはとても良いですね。
でも、読み込んだテキストデータが。。。。

OCRが微妙なので、これはPDF作成用に使っていこうと思います。

‎Microsoft Lens: PDF Scanner
‎Microsoft Office Lens がホワイトボードやドキュメントを撮影した写真のトリミングや拡張を行い、読み取り可能なデータにします。 Microsoft Office Lens を使って、画像を PDF、Word、PowerP...
Microsoft Lens - PDF Scanner - Apps on Google Play
Pocket PDF scanner with integrated OCR

GoogleドライブのOCRサービス

個人的に一番気に入ったのがこのサービスです。

GoogleドライブでOCRができるなんて全く知りませんでした。

やり方は簡単です。写真で撮った画像ファイルを「Googleドライブ」にアップロードして、「Googleドキュメント」で開くだけです。

こんな便利な機能があったなんて知りませんでした。

GoogleドライブOCRサービス利用の画像です。
Googleドライブに文字が書いてある画像をアップロードして、
Googleドキュメントで開くだけでテキストデータが完成します。

さて、OCRの出来栄えはどうでしょうか。再び教科書のモチモチの木の最初のページで試してみました。

あ。結構いい。

写真撮るだけですし、面倒がなさそうですので。これまでの中で修正が少なそうな感じです。

いまのところ第一候補です。

これで読み込ませたテキストをAmazon PollyやGoogle Cloud Text-to-Speechに読ませればいいだけです。

テキスト読み上げAI「Amazon Polly」を導入
字が読みずらい人に配慮して導入いたしました。これを機会にむすこ向けの副教材も作れればと思っています。
Text-to-Speech AI: Lifelike Speech Synthesis | Google Cloud
Turn text into natural-sounding speech in 220+ voices across 40+ languages and variants with an API powered by Google’s ...
スポンサーリンク

他の方法

ボイスレコーダー+GoogleドキュメントかOffice365の音声認識

今のところ、これが一番の候補です。

GoogleやMSOfficeやAppleの音声合成技術はかなり優秀です。

ボイスレコーダーで録音しながら、音声認識でテキストを作って行く。

そして、親父の声だと頭に本が入ってこないと言われたら、音声合成に読ませる。

そんな感じで作って行こうかなと思っています。

ただ、読むの大変です。。。。

スポンサーリンク

まとめ

このように、児童用で特にむすこが好きそうなオーディオブックはほぼ無いに等しいので、少しでも知識を得てもらえるようにやってみようと思います。

私達夫婦に加えて現在6歳の妹も本は大好きです。

むすこにも本の素晴らしさをわかってもらえればなと考えています。

追記

追記:2020年8月20日

学校でもオーディオブックの持ち込みはだめですし、読み聞かせも親がやってあげてもまともに聞いてくれていないので、もう少し簡単な方法で、NHK for School等既存のもので代用しています。

やはり、プロの話し手のものは良いみたいで、興味深く聞いています。

比較的短いお話から触れさせてあげようと思います。

夏休みの課題図書は長すぎてだめですねー

しかし、なんで読書感想文なんかあるんだろ?

昔からの疑問です。

コメント

タイトルとURLをコピーしました