3月10日から14日にかけて長崎で開催された 言語処理学会第31回年次大会(NLP2025)にて、23件の研究発表をおこないました。
- 招待論文 (論文賞受賞論文):クイズコンペティションの結果分析から見た日本語質問応答の到達点と課題
○有山 知希 (東北大), 鈴木 潤 (東北大/理研), 鈴木 正敏 (Studio Ousia), 田中 涼太 (NTT/東北大), 赤間 怜奈 (東北大/理研), 西田 京介 (NTT)
- P2-6 LLMにおける内部表現を用いた日本語スタイル制御メカニズムの分析
高橋 良允, 矢野 一樹 (東北大), 成瀬 健太, 武井 美緒, 梶 佑輔 (楽天), 鈴木 潤 (東北大) - P2-8 Transformer LLMにおける層単位のFFN層の重要度検証
池田 航, 矢野 一樹, 高橋 良允, 李 宰成, 柴田 圭悟 (東北大), 鈴木 潤 (東北大/理研/NII) - P2-13 「数」に着目したLLMの多言語能力の検証
羽根田 賢和 (フューチャー/東北大), 岸波 洋介, 藤井 諒, 森下 睦 (フューチャー) - Q2-17 JHARS: RAG設定における日本語Hallucination評価ベンチマークの構築と分析
亀井 遼平, 坂田 将樹 (東北大), 邊土名 朝飛 (サイバーエージェント/AI Shift), 栗原 健太郎 (AI Shift/サイバーエージェント), 乾 健太郎 (MBZUAI/東北大/理研) - Q2-25 議論形式のマルチエージェント自動評価の詳細分析
内藤 悠, 佐藤 魁 (東北大), 佐々木 翔大 (SB Intuitions/東北大), 鈴木 潤 (東北大/理研/NII) - D4-2 多面的なユーザ意欲を考慮したセールス対話データセットおよび対話システムの構築と評価
邊土名 朝飛, 馬場 惇, 佐藤 志貴 (サイバーエージェント), 赤間 怜奈 (東北大) - Q4-6 LLM事前学習の効率化と性質改善: 埋め込み層および出力層のパラメータ固定による再利用
李 宰成, 矢野 一樹, 高橋 良允, 柴田 圭悟, 池田 航 (東北大), 鈴木 潤 (東北大/理研/NII) - Q4-10 モデル拡張によるパラメータ効率的な LLM の事前学習
矢野 一樹 (東北大), 伊藤 拓海 (東北大/Langsmith), 鈴木 潤 (東北大/理研/NII) - Q4-17 Padding vs. Packing: 大規模言語モデルのファインチューニングにおける学習効果の検証
塩野 大輝 (東北大), 田中 涼太 (東北大/NTT), 宮脇 峻平, 工藤 慧音, 鈴木 潤 (東北大) - Q4-18 Transformer LLMの内部挙動改善:隠れ状態ベクトルの数値的収束性の向上
柴田 圭悟, 高橋 良允, 矢野 一樹, 李 宰成, 池田 航 (東北大), 鈴木 潤 (東北大/理研/NII) - Q6-9 日本語によるコード生成能力の正確な評価に向けて
種口 暁人 (東北大), 藤井 諒, 森下 睦 (フューチャー/東北大), 鈴木 潤 (東北大/理研/NII) - Q6-14 大規模視覚言語モデルの質感知覚能力の分析
松田 陵佑, 塩野 大輝 (東北大), Ana Brassard (理研/東北大), 鈴木 潤 (東北大/理研/NII) - P7-25 ダイアグラム理解に向けた大規模視覚言語モデルの内部表現の分析
吉田 遥音, 工藤 慧音, 青木 洋一 (東北大), 田中 涼太 (東北大/NTT), 斉藤 いつみ, 坂口 慶祐, 乾 健太郎 (東北大) - Q7-23J クイズコンペティションの結果分析から見た日本語質問応答の到達点と課題
有山 知希 (東北大), 鈴木 潤 (東北大/理研), 鈴木 正敏 (Studio Ousia), 田中 涼太 (NTT/東北大), 赤間 怜奈 (東北大/理研), 西田 京介 (NTT) - C8-4 モデル拡張を用いた段階的事前学習によるモデル系列の効率的な構築
矢野 一樹 (東北大), 高瀬 翔 (東北大/SB Intuitions), 小林 颯介 (東北大), 清野 舜 (SB Intuitions), 鈴木 潤 (東北大) - D8-4 大規模言語モデルを用いた対話品質評価に関する調査
赤間 怜奈, 鈴木 潤 (東北大/理研) - Q8-5 日本語バイト符号化マスク言語モデルの開発と分析
工藤 慧音 (東北大/理研), 鴨田 豪, 塩野 大輝 (東北大), 鈴木 潤 (東北大/理研/NII) - Q8-9 モデルマージを用いたLLM翻訳における破滅的忘却の抑制
岩川 光一, Zhu Haocheng, 鈴木 潤 (東北大), 永田 昌明 (NTT) - C9-4 VDocRAG: 視覚的文書に対する検索拡張生成
田中 涼太 (NTT/東北大), 壹岐 太一, 長谷川 拓, 西田 京介, 齋藤 邦子 (NTT), 鈴木 潤 (東北大) - D9-4 MQM-Chat: 対話翻訳のための多次元品質指標
Yunmeng Li (東北大), 鈴木 潤 (東北大/理研), 森下 睦 (フューチャー/東北大), 阿部 香央莉 (MLS/東北大/理研), 乾 健太郎 (MBZUAI/東北大/理研) - P9-10 発話スタイルの類似とユーザ本人による対話の好ましさの相関
沼屋 征海, 守屋 彰二 (東北大), 佐藤 志貴 (東北大/サイバーエージェント), 赤間 怜奈, 鈴木 潤 (東北大/理研) - B10-4 JDD-PAS:規範的な日本語日常対話コーパスへの意味役割ラベル・述語項構造付与
吉野 幸一郎 (東京科学大/理研/NAIST), Lee Sangmyeong (NAIST/理研), 波部 英子 (理研), 大村 舞, 浅原 正幸 (国語研), 若狭 絢 (東北大), 赤間 怜奈, 鈴木 潤 (東北大/理研) - P10-11 対話評価における参照応答集合の妥当性と言語モデルが出力する応答の多様性の関係
佐藤 魁 (東北大), 吉野 幸一郎 (科学大/理研/NAIST), 赤間 怜奈, 鈴木 潤 (東北大/理研)