Gensim

Gensim
作者 Radim Řehůřek
開発元 RARE Technologies Ltd.
初版 2009
最新版
4.3.2[1] / 2022年12月21日 (17か月前) (2022-12-21)
リポジトリ github.com/RaRe-Technologies/gensim
プログラミング
言語
Python
対応OS Linux, Windows, macOS
種別 情報検索
ライセンス LGPL
公式サイト radimrehurek.com/gensim/
テンプレートを表示

Gensim(ジェンシム)は、最新の統計的機械学習を使用した、教師なしトピックモデリング(英語版)自然言語処理のためのオープンソースライブラリである。

Gensimは、Python言語と性能向上を図るためにCython言語で記述されている。Gensimは、データストリーミングとインクリメンタルオンラインアルゴリズムを使用して大規模なテキストコレクションを処理するように設計されており、インメモリ処理のみを対象とした他の多くの機械学習ソフトウェアパッケージとの差別化を図っている[要出典]

主な機能

Gensimには、fastText(英語版)[2]word2vecdoc2vecアルゴリズムのストリーミング並列化実装に加えて[3]潜在意味解析(LSA、LSI、SVD)、非負行列分解(英語版)(NMF)、潜在ディリクレ配分(英語版)(LDA)、tf-idf、およびランダム射影(英語版)が含まれている[4]

Gensimの新しいオンラインアルゴリズムのいくつかは、Gensimの制作者であるRadim Řehůřekの2011年の博士論文『Scalability of Semantic Analysis in Natural Language Processing(自然言語処理における意味解析のスケーラビリティ)』にも掲載されている[5]

Gensimの使用例

Gensimは、2018年の時点で[6]、医学から保険金請求分析、特許検索まで、さまざまな分野で1,400件を超える商用および学術用途で使用および引用されている[7]。このソフトウェアは、いくつかの新しい記事、ポッドキャスト、インタビューでも取り上げられている[8][9][10]

無償および有償サポート

Gensimのソースコードは、GitHub[11]で開発および公開されており、Google Groups[12]Gitter(英語版)[13]上でサポートフォーラムが公開・維持されている。

Gensimは、rare-technologies.com社によって商業的にサポートされている。学生インキュベータープログラムを通じて Gensimの学生メンターシップと学術論文プロジェクトも提供している[14]

脚注

  1. ^ “Release 4.3.2” (24 8月 2023). 18 9月 2023閲覧。
  2. ^ Scalable *2vec training
  3. ^ Deep learning with word2vec and Gensim
  4. ^ Radim Řehůřek and Petr Sojka (2010). Software framework for topic modelling with large corpora. Proc. LREC Workshop on New Challenges for NLP Frameworks
  5. ^ “Scalability of Semantic Analysis in Natural Language Processing” (2011年). 2015年1月27日閲覧。 “my open-source gensim software package that accompanies this thesis”
  6. ^ Gensim academic citations
  7. ^ Commercial adopters of Gensim
  8. ^ Podcast.__init__ episode #71 on Gensim
  9. ^ Interview with Radim Řehůřek, creator of Gensim
  10. ^ “DecisionStats Interview Radim Řehůřek Gensim #python” (2015年12月8日). 2022年1月22日閲覧。
  11. ^ Gensim source code on Github
  12. ^ Gensim mailing list on Google Groups
  13. ^ Gensim chat room on Gitter
  14. ^ Gensim open source Incubator

外部リンク

  • 公式ウェブサイト
  • 表示
  • 編集