まこTech

現役インフラエンジニアの、趣味や依頼のエンジニアリング日記

2021-07-03から1日間の記事一覧

Tesseract OCRのインストール、お試しまで

はじめに 趣味の開発で、機械学習を用いたテキスト分類をしています。 その学習データである文書を用意するのに「画像からの文字抽出」が必要になりました。 たとえばSNS上でシェアされている誰かのチャット画面のスクリーンショット画像から、文書を抽出し…