シナモンが複雑な図表を読み込む大規模言語モデル「Super RAG」を発表
株式会社シナモンが、複雑なレイアウトや図表を含む非構造ドキュメントの読み取りを実現する大規模言語モデル(LLM)「Super RAG」を開発しました。
これまで難しいとされていた手書きの帳票なども読み込みハルシネーション(※)を抑制するため、企業のDX推進を大幅に促進します。
(※ハルシネーション:AIが事実に基づかない情報を生成すること)
この記事の要点
- シナモンが、複雑な非構造ドキュメントを読み取る「Super RAG」を実用化。
- 「Super RAG」は、複雑な表、チャート図、棒グラフなどの情報抽出を可能にし、ハルシネーションを抑制。
- 従来のRAGの課題を解決し、企業のAI活用を大幅に促進する。
「Super RAG」の開発背景
企業のDXを推進するには、大量の社内文書を効率的に活用しなければなりません。
しかし、日本語ドキュメント特有の複雑なレイアウトや専門的な表現、チャート図やダイアグラム、手書きメモまで含めた非構造ドキュメントの読み取りは、これまでの技術では困難でした。
シナモンが開発した「Super RAG」を使うと、従来の課題が解消できます。
企業のDXを支え、業務効率改善やナレッジ活用を促進する、画期的なツールといえるでしょう。
「Super RAG」の技術
「Super RAG」は、Retrieval Augmented Generation (RAG) 技術をベースに、シナモンAIがこれまでに蓄積したAI-OCR、自然言語処理、音声認識などの技術資産を統合し、さらにドメインナレッジの活用やプロンプト自動生成などの独自技術を加えたものです。
これにより、従来難しいとされていた複雑な帳票からの情報抽出が可能になり、企業が抱える大量のドキュメントを、より高精度でかつ迅速に解析が可能になります。
「Super RAG」は企業のDX推進に貢献
「Super RAG」は、これまで情報を取り出すのが難しいとされていた「構造化されていない文書」までも読み取り、データ抽出や解析を行います。
図表やメモ、日本語の複雑な文書なども高い精度で読み取ることが可能です。
データ化が困難だった大量の書類が簡単にデータ化できるため、業務効率の向上や知識共有の促進が見込めます。
「Super RAG」は、外部情報の検索と組み合わせ、回答精度を向上させる技術を取り入れており、回答結果の根拠を明示するのも特徴です。
回答の根拠を明確にすることで、従来の生成AIに見られることの多いハルシネーション(事実に基づかない情報の生成)を抑制する効果が期待されています。
まとめ
従来の生成AIを業務で活用する際に、「複雑な資料の読み取りが困難」「回答精度が低い可能性を含む」など、いくつもの課題がありました。
「Super RAG」の導入でこれらの課題を解決することで、企業のDX促進が期待できます。
引用元:PR TIMES