复制
收藏
提问
简洁
链 其一 描述:试题文件夹下有素材文件 data3.txt,统计文件中出现词频最多的前10个长度 不小于2个字符的词语,将词语及其出现的词频数按照词频数递减排序后显示在 屏幕上,每行显示-一个词语,用英文冒号连接词语及其词频。 输出示例 示例 我们:7 定制:6 建立:5 ...... --------------------------------------------------------- 注意:仅在注释标志之间填入所编写语句。
4月前
回答
更专业一些
# 导入必要的库
import re
from collections import Counter
# 打开并读取文件
with open('试题文件夹/data3.txt', 'r', encoding='utf-8') as file:
text = file.read()
# 使用正则表达式匹配长度不小于2个字符的词语
words = re.findall(r'\b\w{2,}\b', text)
# 统计词频
word_counts = Counter(words)
# 获取词频最多的前10个词语
top_words = word_counts.most_common(10)
# 按照要求格式化输出
for word, count in top_words:
print(f"{word}:{count}")
研究模式展开阅读更多资料、详细回答