女人被狂躁到高潮视频免费无遮挡,内射人妻骚骚骚,免费人成小说在线观看网站,九九影院午夜理论片少妇,免费av永久免费网址

當前位置:首頁 > > 充電吧
[導(dǎo)讀]1.環(huán)境搭建?????import nltk? ??nltk.download("averaged_perceptron_tagger")2、下載以下幾個文件stanford-parser-full-

1.環(huán)境搭建?????import nltk? ??nltk.download("averaged_perceptron_tagger")

2、下載以下幾個文件

stanford-parser-full-2015-12-09??stanford-ner-2015-12-09

stanford-segmenter-2015-12-09?stanford-postagger-full-2015-12-09?

? 修改過的nltk?nltk-develop?????stanford-chinese-corenlp-2018-02-27-models??

前四個包是斯坦福提供的分析資源包,該工具的使用依賴于JAVA環(huán)境需要裝JDK 1.8 在此不贅述,nltk_develop,需要運行其中的setup.py文件,忘了說了,我的環(huán)境是python 36,運行完成后在PYTHON36安裝目錄下的Lib文件夾里面的site-packages里面生成和nltk相關(guān)的3個文件夾,將??修改過的nltk下載下來之后覆蓋即可,最后一個chinese-corenlp則是資源文件

3、 斯坦福詞性標注器安裝部署

????3.2、 斯坦福分詞操作

# -*- coding: utf-8 -*-
from nltk.tokenize.stanford_segmenter import StanfordSegmenter
data_dir = "D:\NLTK\stanford-segmenter-2015-12-09"
segmenter = StanfordSegmenter(
    java_class='edu.stanford.nlp.ie.crf.CRFClassifier',
    path_to_jar=data_dir + "\stanford-segmenter-3.6.0.jar",
    path_to_slf4j=data_dir+"\slf4j-api.jar",
    path_to_sihan_corpora_dict=data_dir+"\data",
    path_to_model=data_dir+"\data\pku.gz",
    path_to_dict=data_dir+"\data\dict-chris6.ser.gz"
    )
sentence = u"這是斯坦福中文分詞器測試"
result = segmenter.segment(sentence)
print(result)

總結(jié)一定要注意path_to_slf4j路徑,否則會出現(xiàn)java.lang.NoClassDefFoundError: org/slf4j/LoggerFactory,錯誤

3.3 StanfordNERTagger? 英文命名實體識別

# -*- coding: utf-8 -*-
from nltk.tag import StanfordNERTagger
eng_tagger = StanfordNERTagger(
    model_filename=r'D:NLTKstanford-ner-2015-12-09classifiersenglish.all.3class.distsim.crf.ser.gz',
    path_to_jar=r'D:NLTKstanford-ner-2015-12-09stanford-ner.jar',
)
print(eng_tagger.tag('Rami Eid is studying at Stony Brook University in NY'.split()))
總結(jié):StanfordNERTagger沒有參數(shù)接收path_to_slf4j參數(shù),還是出現(xiàn)了java.lang.NoClassDefFoundError: org/slf4j/LoggerFactory錯誤
修正方式:修改文件 C:Python36Libsite-packagesnltktagstanford.py文件的函數(shù)tag_sents在? ? ? stanpos_output, stderr 賦值處之前添加
_CLASS_PATH = "."
        if os.environ.get('CLASSPATH') is not None:
            _CLASS_PATH = os.environ.get('CLASSPATH')
        stanpos_output, stderr = java(cmd, classpath=(self._stanford_jar, _CLASS_PATH), stdout=PIPE, stderr=PIPE)
如果之前已經(jīng)覆蓋過Lib里面的site-packages即可跳過

當前,這個方式的前提是在你電腦的環(huán)境變量上CLASSPATH添加slf4j-api.jar的絕對路徑即可

3.4中文命名實體

#對于chinese.misc.distsim.crf.ser.gz與chinese.misc.distsim.prop文件,將stanford-chinese-corenlp-2016-10-31-models.jar解壓可以找到。

# -*- coding: utf-8 -*-
from nltk.tag import StanfordNERTagger
result='四川省 成都 信息 工程 大學(xué) 我 在 博客 園 開 了 一個 博客 , 我 的 博客 名叫 伏 草 惟 存 , 寫 了 一些 自然語言 處理 的 文章 。rn'
chi_tagger = StanfordNERTagger(model_filename=r'D:NLTKstanford-chinese-corenlp-2018-02-27-modelsedustanfordnlpmodelsnerchinese.misc.distsim.crf.ser.gz',
                               path_to_jar=r'D:NLTKstanford-ner-2015-12-09stanford-ner.jar')
for word, tag in chi_tagger.tag(result.split()):
    print(word,tag)
3.5詞性標注

StanfordPOSTagger 中文詞性標注

# -*- coding: utf-8 -*-
from nltk.tag import StanfordPOSTagger
chi_tagger = StanfordPOSTagger(model_filename=r'D:NLTKstanford-postagger-full-2015-12-09modelschinese-distsim.tagger',
                             path_to_jar=r'D:NLTKstanford-postagger-full-2015-12-09stanford-postagger.jar')
result= '四川省 成都 信息 工程 大學(xué) 我 在 博客 園 開 了 一個 博客 , 我 的 博客 名叫 伏 草 惟 存 , 寫 了 一些 自然語言 處理 的 文章 。rn'
print(chi_tagger.tag(result.split()))

3.6中文語法分析

# -*- coding: utf-8 -*-
from nltk.parse.stanford import StanfordParser
chi_parser = StanfordParser(r"D:NLTKstanford-parser-full-2015-12-09stanford-parser.jar",
                            r"D:NLTKstanford-parser-full-2015-12-09stanford-parser-3.6.0-models.jar",
                            r"D:NLTKstanford-chinese-corenlp-2018-02-27-modelsedustanfordnlpmodelslexparserchinesePCFG.ser.gz")
sent = u'北海 已 成為 中國 對外開放 中 升起 的 一 顆 明星'
print(list(chi_parser.parse(sent.split())))

3.7 中文依存句法分析

# -*- coding: utf-8 -*-
from nltk.parse.stanford import StanfordDependencyParser
chi_parser = StanfordDependencyParser(r"D:NLTKstanford-parser-full-2015-12-09stanford-parser.jar",
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? r"D:NLTKstanford-parser-full-2015-12-09stanford-parser-3.6.0-models.jar",
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? r"D:NLTKstanford-chinese-corenlp-2018-02-27-modelsedustanfordnlpmodelslexparserchinesePCFG.ser.gz")
res = list(chi_parser.parse(u'四川 已 成為 中國 西部 對外開放 中 升起 的 一 顆 明星'.split()))
for row in res[0].triples():
? ? print(row)

說明所有資料整理自?

【NLP】干貨!Python NLTK結(jié)合stanford NLP工具包進行文本處理根據(jù)自己的環(huán)境進行的修改,上述代碼可以正常運行
本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

視頻Transformer模型在視頻理解、動作識別等任務(wù)中展現(xiàn)出強大性能,然而其高計算復(fù)雜度和內(nèi)存消耗限制了實際應(yīng)用。為解決這一問題,本文從算法和硬件層面出發(fā),探討視頻Transformer模型的稀疏化加速方法,包括算法...

關(guān)鍵字: Transformer模型 python

在FPGA工具的軟件世界中,用于在FPGA上開發(fā)設(shè)計的ide似乎每年都在加速,我在這里使用“加速”是一個雙關(guān)語。這就意味著不缺少安裝技巧和技巧。所以我在這里再次使用AMD FPGA工具版本2024.2,因為我在這個安裝過...

關(guān)鍵字: FPGA Linux python

在本教程中,我們將指導(dǎo)您使用BleuIO USB BLE加密狗創(chuàng)建一個BLE實時macOS菜單欄應(yīng)用程序。BleuIO是一個非常通用的工具,它簡化了BLE(低功耗藍牙)應(yīng)用程序的開發(fā),使其成為希望輕松構(gòu)建創(chuàng)新項目的開發(fā)人...

關(guān)鍵字: BleuIO 低功耗藍牙 python

在當今快速發(fā)展的硬件設(shè)計領(lǐng)域,自動生成Verilog代碼已成為提高設(shè)計效率和準確性的重要手段。Verilog作為一種廣泛應(yīng)用的硬件描述語言(HDL),其代碼自動生成技術(shù)可以大大縮短產(chǎn)品開發(fā)周期,降低設(shè)計成本。本文將介紹幾...

關(guān)鍵字: Verilog FPGA python

在Linux系統(tǒng)編程中,經(jīng)常需要在程序中執(zhí)行外部命令并獲取其執(zhí)行結(jié)果。無論是基于C/C++、Python、Bash腳本還是其他編程語言,都提供了相應(yīng)的方法來實現(xiàn)這一功能。本文將以C/C++和Python為例,詳細介紹如何...

關(guān)鍵字: Linux系統(tǒng) 外部命令 python

Pipenv是一款旨在將所有包管理工具的優(yōu)點集中利用于python領(lǐng)域中的工具,兼容性高,使用Pipenv可以自動創(chuàng)建項目和管理虛擬環(huán)境,且安裝或刪除包時會自動在Pipfile中添加和移除相應(yīng)的包。

關(guān)鍵字: python 管理工具 虛擬環(huán)境

隨著大數(shù)據(jù)的興起,Python 和機器學(xué)習(xí)迅速成為時代的寵兒。本書在內(nèi)容編排上避免了枯燥的理論知識講解,依循“理論簡述——實際數(shù)據(jù)集——Python 程序?qū)崿F(xiàn)算法”分析數(shù)據(jù)的思路。

關(guān)鍵字: python 機器學(xué)習(xí) 數(shù)據(jù)集

Python擁有很多免費數(shù)據(jù)函數(shù)庫、免費web網(wǎng)頁模板系統(tǒng)、以及與web服務(wù)器進行交互的庫,可以實現(xiàn)web開發(fā),搭建web框架,目前比較有名氣的Python web框架為Django。

關(guān)鍵字: python 函數(shù)庫 免費web網(wǎng)頁

那么用戶下載到的就是該系統(tǒng)的所有源代碼,并且可以隨意修改。這也是解釋型語言本身的特性,想要運行程序就必須有源代碼。

關(guān)鍵字: python 源代碼 C/C++程序

Python有豐富的第三方庫和包,可以擴展Python的功能。為了方便地管理這些包,您需要安裝一個Python包管理工具,例如pip、conda等。這些工具可以幫助您安裝、升級和刪除Python包,使您能夠輕松地管理Py...

關(guān)鍵字: python 編程實例 Python解釋器
關(guān)閉