0
雷鋒網 AI科技評論消息,艾倫人工智能研究院(AI2)開源AllenNLP,它是一個基于PyTorch的NLP研究庫,利用深度學習來進行自然語言理解,通過處理低層次的細節、提供高質量的參考實現,能輕松快速地幫助研究員構建新的語言理解模型。

AllenNLP能讓設計和評估新的深度學習模型變得簡單,幾乎適用于任何NLP問題,通過利用一些基礎組件,你可以輕松地在云端或是你自己的筆記本上跑模型。
關于AllenNLP的詳細信息,可以參見論文AllenNLP: A Deep Semantic Natural Language Processing Platform,地址:http://allennlp.org/papers/AllenNLP_white_paper.pdf
模型對比
下面是AllenNLP模型與相關模型的對比,前者在合理的訓練時間下均能取的較好的表現:
機器理解
機器理解(Machine Comprehension,MC)模型通過在文本內選擇一段內容來回答自然語言問題。AllenNLP MC模型能重現BiDAF(Bi-Directional Attention Flow)的效果,后者在SQuAD數據集上跑分已經接近state-of-the-art。AllenNLP BIDAF在 SQuAD dev數據集中的EM分為68.7,只比原始BIDAF模型的67.7分多一點點,兩者同樣在p2.xlarge上訓練了4個小時。
語義角色標注
語義角色標注(Semantic Role Labeling,SRL)模型分析句子中各成分與謂詞之間的關系,建造表征來回答關于句義的基本問題,如“誰對誰做了什么”等。AllenNLP SRL模型能重現深度BiLSTM模型的效果,在CoNLL 2012上能得到78.9的F1分數。
文字蘊涵
文字蘊涵(Textual Entailment,TE)模型分析兩個句子,分析一個句子中是否蘊涵了另一個句子的知識。AllenNLP TE模型能重現可分解注意力模型的效果,后者在SNLI數據集上有接近state-of-the-art的表現。AllenNLP TE模型得到了84.7分,可以與可分解注意力模型得到的86.3分相提并論。
代碼地址:https://github.com/allenai/allennlp/archive/v0.2.0.zip(zip);
https://github.com/allenai/allennlp/archive/v0.2.0.tar.gz(tar.gz)
更多信息,可以查看:http://allennlp.org/
雷鋒網 AI科技評論編輯整理。雷鋒網。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。