俺のオナニータイム

 

カレンダー

2022年
← July →
Sun Mon Tue Wed Thu Fri Sat
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31            

カウンター

  • 本日のアクセス  
  • 昨日のアクセス  
  • 総アクセス数      

ブログサービス

Powered by

teacup.ブログ
RSS
投稿者
メール

 
コメント
URL
コメントは新しいものから表示されます。
コメント本文中とURL欄にURLを記入すると、自動的にリンクされます。
投稿者:中備
ありがとうございます、勉強になりましたよ〜。
結構履き違えて覚えちゃってたりする事って多いですよね、
自分で勝手に解釈してる事もしばしば…。
投稿者:ZINA
あぁ、間違えた・・・

誤)ORC
正)OCR

吊ってきます・・・
投稿者:ZINA
いやまぁ、真剣に考え込むほど
真面目に話すことでもないのですがね・・・

OCRって、そもそもはOptical Charactor Readerの略で
光学式文字読取装置となります。、

昔は専用のハードウェアを使って文書に光を当て、
読み取った情報を文字として認識させて
テキストデータを作り出すものを指していました。

昨今では文書の読み取りにスキャナを利用して
同様の機能を実現させていますので、そこで得られた画像データを用い、
文字の認識というプロセスをソフトが担当しています。

この2つのを合わせて初めてOCRになるワケですが、
ソフト側の仕事が文字の認識に集約されていることから
OCR=テキストデータへの変換という意味として
誤認されやすい傾向にあるようです。

単に文字を認識させるだけならORCのOは必要ありませんから、
“PDFをOCRにかける”なんて言葉はあり得ない文章となるのです。

まぁ、我ながらこんなことにうるさいのも
どうかとは思いますがね・・・
投稿者:中備
うええ!?自分も文章力ないもので、
何処がおかしい事に気付きませんでした…。
そして正しくはどう書くのかも解りませんです…。
いやぁ、文章は難しいですねー。
投稿者:ZINA
また違う視点の話ですみませんが、人間が古いからか
生来のツッコミ魂が騒ぐのか・・・

「画像をPDFに変換してOCRをかけ、テキストデータを抜き出すことができる。」

いわんとしていることは理解できますが、
文章としては意味不明過ぎてなんだかむずむずしてしまいます。


情報を伝達する側がこんな文章力だから
「インターネット始めました」とか「詳しくはホームページで」みたいな
誤用がまかり通ってしまうのだな、とつくづく感じてしまいました。

ちょっと水を差してしまいましたね・・・
teacup.ブログ “AutoPage”
AutoPage最新お知らせ