DocQA: Japanese Document Question Answering Dataset for Generative Language Models

https://arxiv.org/pdf/2403.19454 今回は日本語で書きます イントロ JdocQAは日本語のVQAデータセットの一種である 4つの回答からなり,基本的にCommon senseを試すような内容となっている これらのベンチマークを作成することはLLMのハルシネーションを削減することにつながる 関連研究 VQAのモデルとか データセットもVQAに関するOCR-VQAとか 実験 Yes/no, factoroid, numerical questions, BLEU scoreとかで評価 先行研究との比較は,英語ではないということ,画像数,クエスチョンの数が比較的多いということ

May 10, 2025 - 07:47
 0
DocQA: Japanese Document Question Answering Dataset for Generative Language Models

https://arxiv.org/pdf/2403.19454
今回は日本語で書きます

イントロ
JdocQAは日本語のVQAデータセットの一種である
4つの回答からなり,基本的にCommon senseを試すような内容となっている
これらのベンチマークを作成することはLLMのハルシネーションを削減することにつながる

関連研究
VQAのモデルとか
データセットもVQAに関するOCR-VQAとか

実験
Yes/no, factoroid, numerical questions, BLEU scoreとかで評価
先行研究との比較は,英語ではないということ,画像数,クエスチョンの数が比較的多いということ