PDF 読み取り性能が高い AI はどれ?
OpenAI の API、Gemini の API、Anthropic の API にて、それぞれ解像度の低い PDF の読み取り精度を調査した。
結果、Gemini の API がダントツだった。
OpenAI の方は最新モデルの最上モデルでもまったくダメ、Anthropic は最新モデルの最上モデルなら OK だがあとは全滅、その点、Gemini なら多少安価なモデルでも読み取り可能という結果だった。
正直、ここまで大きな差が出るとは思っていなかった。
いちばんびっくりしたのが、OpenAI がまったく読み取れなかったことだ。
前述のとおり、解像度が低い PDF ではあるのだが、人間の目では問題なく読み取れる。
このレベルの PDF さえ、しかも最上級モデルさえ読み取れないのは驚きだ。
Gemini の読み取り性能が高いのは関心したが、逆にどの AI でも読み取れると思っていただけに、Gemini はその結果にこたえられただけで、驚くことはなかったが、さすがは Google といったところだろう。
しかし、本当にこのままでは OpenAI はまずいのではないだろうか。
今、OpenAI がほかの AI に勝っているところは逆になんだろうか。
AI 化社会の勝者も、やはり Google なのだろうか。
結果、Gemini の API がダントツだった。
OpenAI の方は最新モデルの最上モデルでもまったくダメ、Anthropic は最新モデルの最上モデルなら OK だがあとは全滅、その点、Gemini なら多少安価なモデルでも読み取り可能という結果だった。
正直、ここまで大きな差が出るとは思っていなかった。
いちばんびっくりしたのが、OpenAI がまったく読み取れなかったことだ。
前述のとおり、解像度が低い PDF ではあるのだが、人間の目では問題なく読み取れる。
このレベルの PDF さえ、しかも最上級モデルさえ読み取れないのは驚きだ。
Gemini の読み取り性能が高いのは関心したが、逆にどの AI でも読み取れると思っていただけに、Gemini はその結果にこたえられただけで、驚くことはなかったが、さすがは Google といったところだろう。
しかし、本当にこのままでは OpenAI はまずいのではないだろうか。
今、OpenAI がほかの AI に勝っているところは逆になんだろうか。
AI 化社会の勝者も、やはり Google なのだろうか。