-
樓上的程式存在很多問題,例如無法處理標點符號、讀取檔案的方式錯誤等。
建築物是否主要區分大小寫? 如果您想做出區分,讓我們遵循以下內容:
import re
def get_word_frequencies(file_name):
dic = {}
txt = open(filename, 'r').read().splitlines()
以下句子將除'-'在所有標點符號之外,因為'-'可能存在於言語中。
txt = '[^\u4e00-\u94a5\w\d\-]', ' ', txt)
將單獨的'-'
txt = ' - ', ' ', txt)for line in :
for word in :
如果不區分大小寫,則視為小寫,以下句子將改為 0)、0)。
dic[word] += 1
print dic
if __name__ = '__main__':
get_word_frequencies(''如果您有任何問題,請繼續提問。
-
這個想法是這樣的:
將檔案的內容讀入鍊表,使用鍊表的count()函式計算空格數n個,然後迴圈n次,標記每個單詞前後的空格,取出單詞,放在word[]的空鍊表中,然後使用count()函式計算出現次數, 把它放在另乙個數字【】空鍊表裡,迴圈執行後,結果output=dict(zip(word,number))就是最終的字典輸出;
或者可以使用re正規表示式直接找到空格中間的單詞,將其輸出到新的鍊表中,然後直接對每個單詞進行計數。
-
dic = {}
for line in open(filename):
for word in :
dic[word] += 1
關於這個,DIC就是你想要的,這種事情你自己處理就行了;
獲取 ['-other don't']。
-
總結。 如何在python中計算英文文章中的單詞和句子總數。
詢問自定義訊息]。
箭頭和歌曲。 henry wadsworth longfellow(1807-1882)
我向天空射了一支箭,我不知道它落在了哪裡。 >>>More
我每天背對了數的單詞,去年我背了一年,下面我們來分享一下我的經驗:我用的“音樂詞”計畫每天背40到45個左右,複習計畫會慢慢變成85到100個。 我通常跳過早上的複習任務,把它新增到字典中,沒有任何成為新詞的印象,有時間的時候多讀例句。 >>>More
拍手、剁碎、薯片、小夥子、營地露營、剪貼回形針、廢話、莊稼、政變政變。 >>>More
我個人認為,“多義詞”在任何語言中都是不可避免的現象,是由“不同的用法”引起的,但“不同的詞源”只出現在“同義詞”中。 >>>More