森羅2020-JP: タスク参加募集


森羅2020-JP 日本語構造化タスク参加募集

データリリース&参加募集開始: 2020年5月11日
結果提出締切: 2020年11月10日(※当初予定の2020年9月10日から変更) 


森羅プロジェクトは2017年にスタートしたリソース構築プロジェクトで、Wikipediaに記述されている知識を計算機が扱える形に構造化することを目指し、「協働によるリソース構築(Resource by Collaborative Contribution(RbCC))」という枠組みで、評価型タスクとリソース構築を同時に進めています。

日本語構造化タスクは森羅プロジェクトで2018年から実施している日本語Wikipediaを対象とした情報抽出タスクで、今回が3回目となります。

記事の対象について多様な語彙や形式で記述された情報を、対象の分類毎に定められた共通の属性情報(例えば対象の分類が人名の場合は「国籍」や「地位職業」等)に整理した上で取り出すタスクです。

初回から取り組んでいる人物、市区町村、企業、化合物、空港と、今回2回目となる場所、組織に関する属性情報に加え、イベント、施設に関する属性情報の抽出にも挑戦します。

参加システムの出力結果を統合することで、大規模な構造化データを構築することを目指しています。多くの方のご参加をお待ちしています。

*タスク関連ビデオ/スライド

  • 森羅2020-JP/ML 中間説明会録画  [video](7/31録画, 約56分)(*1含む)
  • 森羅2020-JP/ML タスク概要  [slide] (7/31)*1
  • 森羅2020-JP タスク概要  [video](5/10, 約14分), [slide](5/11)
  • 森羅2020-JP タスクデータ等  [slide] (7/31)*1
  • 森羅2020-JP リーダーボード  [slide](5/11)
  • 拡張固有表現階層定義Ver.8.1  [video] (5/7,約11分), [slide](5/11)
  • 森羅2020-JP 日本語構造化タスク説明会(オンライン質問会)  [video](5/18録画,約39分)
  • *メーリングリスト/Slack(参加者用)

    [メーリングリスト] shinra2020-jp-all
     参加リンク

    [Slack] 森羅:Wikipedia構造化プロジェクト(shinra-project.slack.com)
     参加リンク

    *スケジュール

     データリリース&参加募集開始:2020年5月11日
     オンライン質問会:2020年5月18日 (16:00-17:00)
     中間説明会:2020年7月31日 (10:00-11:00)
     実行結果提出〆切:2020年11月10日(※当初予定の2020年9月10日から変更)

     ・評価結果返却は実行結果提出から2週間程度、最終報告会は12月頃の予定です。
     ・今後の予定(評価結果返却、最終報告会)は決まり次第、ホームページ、メーリングリスト、Slack等でお知らせします。
     ・参加を検討される方は上記のメーリングリスト、Slackにぜひご参加下さい。

    *対象カテゴリ

    以下に本タスクで対象とする拡張固有表現(ENE)階層(ver.8.1)のカテゴリの概略を示します。詳細なリストはこちらをご覧下さい。

     ・JP-5
      森羅2018-JPから継続して対象としている5カテゴリ
      人名、市区町村名、企業名、化合物名、空港名

     ・Location(地名)
      大陸地域名、国名、国内地域名、山地名、河川名等、計14カテゴリ

     ・Organization(組織名)
      政府組織名、国際組織名、競技団体名、公演組織名等、計14カテゴリ

     ・Event(イベント名)
      競技会名、選挙名、戦争名、地震名等、計12カテゴリ

     ・Facility(施設名)
      学校名、鉄道駅名、商業施設名、競技施設名等、計33カテゴリ

    *実行委員

    【委員長】
    関根聡(理研AIP)

    【委員】
    乾健太郎(東北大/理研)
    岩倉友哉(富士通)
    大関洋平(東大)
    奥村学(東工大)
    小原京子(慶応大)
    河原大輔(京大)
    木村泰知(小樽商科大)
    後藤美知子(理研AIP)
    小林隼人(ヤフー)
    鈴木正敏(東北大)
    隅田飛鳥(理研AIP)
    中山功太(筑波大/理研AIP)
    野本昌子(理研AIP)
    馬場雪乃(筑波大)
    松田耕史(理研AIP/東北大)
    山田育矢(Studio Ousia/理研)
    吉岡真治(北大)
    <以上:理研AIP関係者>

    相澤彰子(NII)
    浅原正幸(国研)
    荒牧英治(奈良先端大)
    安藤まや(LC)
    市瀬龍太郎(NII)
    宇佐美佑(合同会社宇佐美)
    荻野孝野(JSA)
    加藤恒昭(東大)
    菊井玄一郎(農研機構)
    黒橋禎夫(京都大)
    古宮嘉那子(茨城大)
    榊剛史(ホットリンク)
    貞光九月(フューチャーアーキテクト)
    佐藤敏紀(LINE)
    進藤裕之(奈良先端大)
    新納浩幸(茨城大)
    鈴木久美(MS)
    須藤克仁(奈良先端大)
    高村大也(AIRC)
    徳永健伸(東工大)
    中野幹生(HRI)
    西田豊明(福知山公立大)
    林良彦(早稲田大)
    東中竜一郎(名古屋大)
    福本文代(山梨大)
    松井邦夫(金沢工大)
    宮尾祐介(東大)
    村上浩司(楽天)
    横野光(富士通研)

    *連絡先
    Email(実行委員宛): shinra2020jp-info (at) googlegroups.com
    Slack: 森羅:Wikipedia構造化プロジェクト(shinra-project.slack.com)
    参加リンク

    *関連リンク

    森羅2020-JP:日本語構造化タスク
    リーダーボード
    拡張固有表現