数据挖掘 : 手把手教你做文本挖掘
发布时间:2020-12-24 23:16:16 所属栏目:大数据 来源:网络整理
导读:副标题#e# 文本挖掘定义 文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法。文本挖掘中最重要最基本的应用是实现文本的分类和聚类,前者是有监督的挖掘算法,后者是无监督的挖掘算法。 ? 2 文本挖掘步骤 1)读取数据库或本地外
副标题[/!--empirenews.page--]
文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法。文本挖掘中最重要最基本的应用是实现文本的分类和聚类,前者是有监督的挖掘算法,后者是无监督的挖掘算法。 ? 1)读取数据库或本地外部文本文件 2)文本分词 2.1)自定义字典 2.2)自定义停止词 2.3)分词 2.4)文字云检索哪些词切的不准确、哪些词没有意义,需要循环2.1、2.2和 2.3步骤 3)构建文档-词条矩阵并转换为数据框 4)对数据框建立统计、挖掘模型 5)结果反馈 (编辑:滁州站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |