Japan
メニュー
ヘルプ
閉じる

Japan

東芝AI技術カタログ

メディア解析・処理テキスト解析・処理

類義表現抽出

複数単語の組合せ表現(n-gram)の意味の近さを定量化します。

  • ・n-gramの長さごとにネットワークを用意し、隠れ層から出力層にかけて接続することで、n-gramの長さごとの違いを考慮して重みを更新します。
  • ・n-gramの意味の近さを正確に捉えることで、大量の文書から効率よく所望の文書を見つけることができます。
類義表現抽出イメージ

応用先

  • ・文書検索・分類システム

ベンチマーク・強み・実績

  • ・従来手法に比べ、複数の単語同士の意味の近さを高精度に推定可能(言語処理学会第25回年次大会)

問い合わせ窓口

東芝研究開発センターへのお問合せ

問合せの際はタイトル[AI技術カタログ:類義表現抽出]やURLを文面に含めてください。
本技術は研究開発中のためご要望にすぐに対応できない可能性があります。

参考文献:

  • ・山崎智弘, “長さの異なるn-gram同士の関係を考慮したn-gram埋め込み”, 言語処理学会第25回年次大会, 2019.