软件 | OpenRefine(数据清洗工具) v2.6 for Windows 官方免费版(附使用教程) |
图标 | ![]() |
分类 | 软件下载-系统工具-系统其它-OpenRefine2.6下载 系统其它 |
语言 | 简体中文 |
大小 | 36.7MB |
软件类型 | 国产软件 |
发布时间 | |
用户评分 | 3 |
备案号 | |
官方网址 | |
软件授权 | 免费软件 |
操作系统 | Windows平台 |
厂商 | |
下载 | ![]() |
介绍 |
OpenRefine v2.6 for windows版是一款非常简单易用的专业数据优化和清洗工具,所谓的数据清洗就是检查数据库中无用和错误的地方然后进行修正,支持残缺数据、错误数据以及重复数据的搜索和清洗,旨在提高数据库的结构化和规范化,小编还为大家带来了OpenRefine的安装和使用教程供大家参考,需要此款工具的朋友们欢迎前来下载使用。 安装方法 1、OpenRefine在Windows的安装 下载ZIP包 解压到某个目录; 要运行OpenRefine,双击openrefine.exe文件。 2、OpenRefine在Mac的安装 下载DMG文件 打开磁盘镜像,拖动OpenRefine的图标到Applications目录; 双击图标以启动OpenRefine。 下载gzipped包 解压到当前用户的home目录; 在终端命令行环境,键入./refine以启动OpenRefine。 使用说明 首先我们得载入数据文件 打开Open Refine, 点击屏幕左侧的“新建项目” (Create Project) 先点击“这台电脑” (This Computer),然后点击“选择文件”(Choose Files)。 在你的数据文件中选择UniversityData.csv。你就会看到数据。 该文件中有些中文文字(列的名字)。如果中文显示不对,你也许需要告诉Open Refine使用正确的字符集。要做到这一点,点击“字符编码” (Character encoding) 旁边的空白空间,从中选择UTF-8。 然后点击右边的“新建项目” (Create Project) 键。 你可以看到country (“国家”)这一列中, 国家名字不统一。例如,美国即叫 United States,也叫USA。我们要通过创立一个文字归类, 让Open Refine 给我们看 country 一列中所有的值。摁下 country 旁边的小下箭头,选择 归类 Facet -> 文本归类 Text Facet。 片刻后,该归类中所有国家的值就会在屏幕左侧显示出来。 你可以看到美国有多个不同叫法, 还有一些错误的名字,比如有一行美国叫United States ), 还有一个捏造的国家叫Utopia(乌托邦)!每个不同的国家名叫一个归类, Open Refine 给你显示了每一个归类里有多少行数据。 点击任何归类名字,你会只看到那个归类里的行。在我们这个例子里,你只会看到那些国家列里数据和你点击的名字相符的行。 你只要点击任何一个归类名,就能对其进行编辑。现在我们来把美国所有不同的叫法都变成United States。 你鼠标指向 US 这一归类时,一个的“编辑”edit 选项就会出现。点击该 编辑 edit。 请打入United States, 然后点击 应用 Apply。 现在所有是 US 的2609行都变成了United States。 对每一个别的叫法都同样进行编辑,直到美国所有的叫法都变成United States。 你做完后,你的归类应该如下: |
截图 | |
随便看 |
|
网盟-旗舰软件下载站,将绿色免费商业版破解软件、共享软件、游戏、电影、电视剧一网打尽!