《开源精选》是我们分享Github、Gitee等开源社区中优质项目的栏目,包括技术、学习、实用与各种有趣的内容。本期推荐的是一个开源机器学习和数据可视化工具——orange。
Orange 是一个基于组件的数据挖掘和机器学习软件套装,它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。其由 C++ 和 Python/ target=_blank class=infotextkey>Python 开发,它的图形库是由跨平台的Qt框架开发。使用 Orange无需编程或深入的数学知识。
功能特性
交互式数据可视化:通过巧妙的数据可视化执行简单的数据分析。探索统计分布、箱线图和散点图,或者深入了解决策树、层次聚类、热图、MDS 和线性投影。甚至多维数据也可以在 2D 中变得有意义。
可视化编程:交互式数据探索,通过清晰的可视化操作进行快速定性分析。图形用户界面使您可以专注于探索性数据分析而不是编码,而巧妙地默认设置使数据分析工作流程的快速原型设计变得非常容易。
数据科学教育:Orange 是实践培训的完美工具。教师享受清晰的程序设计和数据模型的可视化探索。学生受益于该工具的灵活性和发明数据挖掘方法新组合的能力。Orange 教育力量来自可视化编程和交互式可视化的结合。
附加组件扩展功能:使用 Orange 中可用的各种插件从外部数据源中挖掘数据、执行自然语言处理和文本挖掘、进行网络分析、推断频繁项集和进行关联规则挖掘。此外,生物信息学家和分子生物学家也可以使用 Orange 通过差异表达对基因进行排序并进行富集分析。
附加组件
示例
在文件小部件中加载和编辑数据
绘制二维数据集
散点图中的数据选择在箱线图中可视化
使用分类树进行探索性分析
数据可以包含对图像的引用
交互式梯度下降
最近推文的主题建模
具有深度网络嵌入的图像分析
安装
安装程序
https://download.biolab.si/download/files/Orange3-3.32.0-Miniconda-x86_64.exe
或者使用pip
pip install orange3
提示:通过安装附加组件,可以将附加功能添加到 Orange。您可以在选项菜单中找到附加管理器。
开源协议:GPL3.0
开源地址:https://github.com/biolab/orange3