2017年06月10日

理系に忍び寄る情報(IT)系の波 〜Math on the Webという研究領域〜

応援クリックを1日1回宜しくお願いいたします。



数式が記述された文書には4種類あると考えられます。
    1. PDF
    1. HTML
    1. 画像
    1. MicrosoftのOfficeのような、「製品」

これらの内、1〜3を対象とした、数式検索という情報系の研究領域があります。

PDFや画像に書かれた数式のキャプチャを対象として、数式の中の位置関係を解析して何が書かれているかを判定するという技術があります。

また、HTMLに記述されたプログラミング言語(言語についてはこちらの記事をどうぞ)を対象としてそのソースコードから数式を判定する方法論もあります。







いずれの方法も情報系という学問分野でほとんど前進力の無い研究領域なので、今から情報系の研究者もしくはアマチュア研究者になろうとしている方々はこの領域で論文を産することができます。

どれくらい前進していないかというと、日本国内では論文が1年に5本もでていないほどです。

2015年以降はおそらく1年に1本です。
↓↓↓調査結果
数式検索の論文

この理由には、Webページ上で数式を表示することさえ2011年頃まで困難だったことや、画像で表示された数式を対象とした数式の認識が困難だったりしたことが挙げられます。

また、情報系なので「便利に使われてナンボ」の世界であって、ただ方法論や可能性を示すだけでは物足りず、実用的な話である必要はあります。

ただ、エンドユーザに近いところの話なので、この方がいんじゃね、というような発想やアイディアが重要で、もちろん数式を眺め慣れた人による数式検索の方法の案は非常に貴重で有用となります。

そういうことで、情報系もしくはプログラマに進む理系の人は、数式検索の研究領域に踏み出してみてはいかがでしょうか。

ちなみに、日本語の論文がいくらか見つかりますので、ご一読あれ。
↓↓↓
数式検索の論文


タグ:web 技術 IT 数学 tex

posted by Line Segment at 18:00 | Comment(0) | TrackBack(0) | ホームページ | このブログの読者になる | 更新情報をチェックする