「構造化知識を使った言語処理応用」ワークショップ

~森羅2022最終報告会~

本ワークショップでは、現在、日本での自然言語処理の代表的なデータ(R4C, 日本語Roberta,日本語GPT-2,JGLUE, mLUKE, 森羅など)を作られている先生方をお招きして「構造化された知識をどのように言語処理アプリケーションに利用するのか」についてパネルパネルディスカッションを行います。また、協働による知識構築の手法でWikipediaの構造化を目指している、森羅プロジェクトの2022年の最終報告会も併せて行います。

<日時>
2023年1月18日(水) 14:00-16:30

<参加方法>
形式:オンライン(Zoom) =参加登録の際にリンクをお渡しします
 ※当日はミーティングを録画し、後日Web公開する予定です。

<参加申し込み>
こちらからどうぞ(終了いたしました)

<タイムテーブル>
14:00 オープニング(動画, スライド)
14:05 森羅2022最終報告会
 14:05 タスク説明&結果報告(動画, スライド1, スライド2)
 14:20 参加システムの紹介(動画)
  (発表予定者)
  ・分類タスク
   - 秋山様(東京農工大学)(スライド)
   - 小川様(UNICORN株式会社)(スライド)
   - 木村様(同志社大学)(スライド)
   - 波多野様(東京都立産業技術高等専門学校)(スライド)
  ・属性値抽出タスク
   - 武本様(横浜市立大学)(スライド)
   - 三浦様(株式会社アティード)(スライド)
  ・リンキングタスク
   - 陰山様(筑波大学)(スライド)
(15:00 休憩)
15:10 パネルディスカッション(動画)
 「構造化知識を使った言語処理応用」
  ・井之上直也先生(北陸先端科学技術大学院大学)(スライド)
  ・河原大輔先生(早稲田大学)(スライド)
  ・山田育矢様(株式会社Studio Ousia)(スライド)
  ・中山功太(理研AIP/筑波大学)
  ・関根聡<司会>(理研AIP)
 ※最初に各パネリストのそれぞれの立場から5分程度のトークを行った後、ディスカッションを行います。最後に一般参加者からの質問を受け付けます。
16:10 森羅2023について(動画, スライド)
16:25 クロージング
(16:30 閉会)

森羅2022実行委員会
理研AIP 言語情報アクセス技術チーム

====
(パネリスト紹介)

・井之上直也先生(北陸先端科学技術大学院大学)
知識を使って推論し言葉の行間を読むマシンをつくることを目指し、構造化知識とテキスト上の知識の統合的埋め込みによる説明付き推論などの研究に取り組んでいる。読解システムのためのベンチマークR4C、簡潔に説明可能な質問応答システムSuQAなどを公開。

・河原大輔先生(早稲田大学)
人間と同程度に言語を理解することのできる人工知能システムを目指し、言内・言外の意味を統合した知識フレームの獲得と言語理解への応用などの研究に取り組んでいる。RoBERTa日本語Pretrainedモデル、GPT-2日本語Pretrainedモデル、日本語言語理解ベンチマークJGLUEなどを公開。

・山田育矢様(株式会社Studio Ousia)
2007年に自然言語処理の研究開発を行うStudio Ousiaを共同創業。自然言語処理のシステムを構造化された知識で改善することに取り組んでいる。多言語単語及びエンティティの文脈付き訓練済みモデルmLUKE、多言語テキスト分類モデルM-BoE、エンティティリンキングモデルSTEELなどを開発、公開。開発した質問応答技術は、世界最高峰のAIに関する国際会議NIPS(現NeurIPS)2017で開催されたコンペティションにおいて世界最高性能を獲得。

・中山功太(理研AIP/筑波大学)
理研AIPにて、学生インターンからリサーチアソシエイトとなり、森羅プロジェクトの実行委員として開始当初から継続的に携わる。森羅の分類、属性抽出タスクのベースラインシステムを深層学習を用いて実現。今年度、延べ700人を集めた4回にわたる「学生・若手研究者のためのBERTワークショップ」において講師を務めるなど深層学習の技術に詳しい。

・関根聡<司会>(理研AIP)
ニューヨーク大学にて情報抽出、固有表現抽出などの研究を推進。2017年から理研AIPにてWikipediaの構造化知識「森羅」を「協働による知識構築」という手法により構築するプロジェクトを推進。パナソニック、SONY、楽天技術研究所NYなどの研究所でも活躍。