森羅2020-JP: タスク参加募集


森羅2020-JP 日本語構造化タスク参加募集

データリリース&参加募集開始: 2020年5月11日
オンライン質問会: 2020年5月18日16:00-17:00(Cisco WebEx)
参加登録&結果提出締切: 2020年9月10日


森羅プロジェクトは2017年にスタートしたリソース構築プロジェクトで、
Wikipediaに記述されている知識を計算機が扱える形に構造化することを
目指し、「協働によるリソース構築(Resource by Collaborative
Contribution(RbCC))」という枠組みで、評価型タスクとリソース構築
を同時に進めています。

日本語構造化タスクは森羅プロジェクトで2018年から実施している日本語
Wikipediaを対象とした情報抽出タスクで、今回が3回目となります。

記事の対象について多様な語彙や形式で記述された情報を、対象の分類毎に
定められた共通の属性情報(例えば対象の分類が人名の場合は「国籍」や
「地位職業」等)に整理した上で取り出すタスクです。

初回から取り組んでいる人物、市区町村、企業、化合物、空港と、今回2回
目となる場所、組織に関する属性情報に加え、イベント、施設に関する属性
情報の抽出にも挑戦します。

参加システムの出力結果を統合することで、大規模な構造化データを構築す
ることを目指しています。多くの方のご参加をお待ちしています。

*オンライン質問会

5月18日にオンライン質問会を予定しています。以下のリンクからぜひご参加
ください。

日時:5月18日 16:00-17:00(森羅2020-JP 日本語構造化タスク説明会)
Meeting URL
Meeting password: ugQybTa5i53

 ・以下のタスク関連ビデオ/スライドをぜひ事前にご覧下さい。
 ・なお、質問会は録画し、質疑応答も含めYouTube等で公開させていただ
  く予定です。

*タスク関連ビデオ/スライド

 ・森羅2020-JP日本語タスク概要
  [video] [slide]
 ・森羅2020-JP タスクデータ等についての説明
  [video] [slide]
 ・森羅2020-JP リーダーボード
  [slide]
 ・拡張固有表現階層定義Ver.8.1
  [video] [slide]

*メーリングリスト/Slack(参加者用)

[メーリングリスト] shinra2020-jp-all
 参加リンク

[Slack] 森羅:Wikipedia構造化プロジェクト(shinra-project.slack.com)
 参加リンク

*スケジュール

 データリリース&参加募集開始:2020年5月11日
 オンライン質問会:2020年5月18日 (16:00-17:00)
 実行結果提出〆切:2020年9月10日

 ・今後の予定(中間報告会、評価結果返却、最終報告会)は決まり次第、
  ホームページ、メーリングリスト、Slack等でお知らせします。
 ・参加を検討される方は上記のメーリングリスト、Slackにぜひご参加下さい。

*対象カテゴリ

以下に本タスクで対象とする拡張固有表現(ENE)階層(ver.8.1)のカテゴ
リの概略を示します。詳細なリストはこちらをご覧下さい。

 ・JP-5
  森羅2018-JPから継続して対象としている5カテゴリ
  人名、市区町村名、企業名、化合物名、空港名

 ・Location(地名)
  大陸地域名、国名、国内地域名、山地名、河川名等、計14カテゴリ

 ・Organization(組織名)
  政府組織名、国際組織名、競技団体名、公演組織名等、計14カテゴリ

 ・Event(イベント名)
  競技会名、選挙名、戦争名、地震名等、計12カテゴリ

 ・Facility(施設名)
  学校名、鉄道駅名、商業施設名、競技施設名等、計33カテゴリ

*実行委員

【委員長】
関根聡(理研AIP)

【委員】
乾健太郎(東北大/理研)
岩倉友哉(富士通)
大関洋平(東大)
奥村学(東工大)
小原京子(慶応大)
河原大輔(京大)
木村泰知(小樽商科大)
後藤美知子(理研AIP)
小林隼人(ヤフー)
鈴木正敏(東北大)
隅田飛鳥(理研AIP)
中山功太(筑波大/理研AIP)
野本昌子(理研AIP)
馬場雪乃(筑波大)
松田耕史(理研AIP/東北大)
吉岡真治(北大)
<以上:理研AIP関係者>

相澤彰子(NII)
浅原正幸(国研)
荒牧英治(奈良先端大)
安藤まや(LC)
市瀬龍太郎(NII)
宇佐美佑(合同会社宇佐美)
荻野孝野(JSA)
加藤恒昭(東大)
菊井玄一郎(農研機構)
黒橋禎夫(京都大)
古宮嘉那子(茨城大)
榊剛史(ホットリンク)
貞光九月(フューチャーアーキテクト)
佐藤敏紀(LINE)
進藤裕之(奈良先端大)
新納浩幸(茨城大)
鈴木久美(MS)
須藤克仁(奈良先端大)
高村大也(AIRC)
徳永健伸(東工大)
中野幹生(HRI)
西田豊明(福知山公立大)
林良彦(早稲田大)
東中竜一郎(名古屋大)
福本文代(山梨大)
松井邦夫(金沢工大)
宮尾祐介(東大)
村上浩司(楽天)
山田育矢(Studio Ousia)
横野光(富士通研)

*連絡先
Email(実行委員宛): shinra2020jp-info (at) googlegroups.com
Slack: 森羅:Wikipedia構造化プロジェクト(shinra-project.slack.com)
参加リンク

*関連リンク

森羅2020-JP:日本語構造化タスク
リーダーボード
拡張固有表現