DocQA: Japanese Document Question Answering Dataset for Generative Language Models

https://arxiv.org/pdf/2403.19454 今回は日本語で書きますイントロ JdocQAは日本語のVQAデータセットの一種である 4つの回答からなり，基本的にCommon senseを試すような内容となっているこれらのベンチマークを作成することはLLMのハルシネーションを削減することにつながる関連研究 VQAのモデルとかデータセットもVQAに関するOCR-VQAとか実験 Yes/no, factoroid, numerical questions, BLEU scoreとかで評価先行研究との比較は，英語ではないということ，画像数，クエスチョンの数が比較的多いということ

May 10, 2025 - 07:47

0

DocQA: Japanese Document Question Answering Dataset for Generative Language Models

https://arxiv.org/pdf/2403.19454
今回は日本語で書きます

イントロ
JdocQAは日本語のVQAデータセットの一種である
4つの回答からなり，基本的にCommon senseを試すような内容となっている
これらのベンチマークを作成することはLLMのハルシネーションを削減することにつながる

関連研究
VQAのモデルとか
データセットもVQAに関するOCR-VQAとか

実験
Yes/no, factoroid, numerical questions, BLEU scoreとかで評価
先行研究との比較は，英語ではないということ，画像数，クエスチョンの数が比較的多いということ

Tags:

Previous Article

Demystifying AI: A No-Nonsense Guide for Developers

How to Manage Flutter Versions with FVM for Older Projects?

Related Posts

The Fun Kubernetes: Launch Your First Kubernetes App on Amazon EKS

The Fun Kubernetes: Launch Your First Kubernetes App on...

May 6, 2025 0

I Lost It All - My Tech Story

I Lost It All - My Tech Story

May 2, 2025 0

Playing Minecraft APK Offline: Tips for Survival Mode Success

Playing Minecraft APK Offline: Tips for Survival Mode S...

Apr 27, 2025 0

This site uses cookies. By continuing to browse the site you are agreeing to our use of cookies.