Press "Enter" to skip to content

DataSpell 数据挖掘代码编辑器

Dataspell——一个专为数据科学家制作的IDE。一方面,您拥有 Jupyter 以实现最大的交互性,另一方面拥有 PyCharm 作为专业环境。

什幺是DataSpell?

 

Dataspell 是专为数据科学家制作的 IDE(集成开发环境)。它由 Jetbrains ( IntelliJ Idea 和 PyCharm 背后的一家公司)开发,支持所有主要操作系统平台,包括 ARM (M1) Mac。

 

DataSpell亮点:

 

原生notebook体验——如果你使用过 Jupyter 会有宾至如归的感觉。

 

智能代码辅助 – 有点像 Jupyter 和 PyCharm 生了孩子。

 

Markdown 和 JavaScript — 根据需要设置notebook样式并嵌入数据可视化。

 

交互式外壳 – REPL 控制台 + 语法检查。

 

SQL 数据库支持 — 连接到数据库、直观地检查数据、导入/导出数据等。

 

打开dataspell,很像PyCharm

 

 

创建你的第一个notebook

 

该过程几乎与任何其他 Jetbrains 产品相同。点击根目录,进入新建——Jupyter Notebook:

 

 

我将其命名为 first_notebook.ipynb。

 

 

样式是个人喜好的东西,但你不能说设计不是一流的。

 

在创建笔记本时,您可能已经看到创建 R 脚本和 Markdown 文件的选项。一旦 Python 正常运行,Dataspell 将同时支持 R 和 Julia(来源)。

 

现在让我们探索基本的 Python 和数据科学库是如何工作的。下图显示了 Numpy 数组和 Pandas DataFrame:

 

 

正如预期的那样。我喜欢 Numpy 数组打印为 Pandas 系列的方式,但这只是个人喜好。Matplotlib 呢?这是一个真正简单的散点图:

 

 

我更喜欢出版物可视化的白色背景,但在晚上工作时眼睛无法长时间工作,夜晚我喜欢黑色背景。干得好,Dataspell。

 

接下来,让我们探索每个 IDE 必须具备的功能——智能编码辅助。

 

智能编码辅助

 

我不喜欢 JupyterLab 的是缺乏编码帮助。确实有插件,但它们的帮助远不及专业的 IDE。我不喜欢 IDE 的是缺乏交互性。希望 Dataspell 将是两全其美的。

 

让我们尝试导入 Numpy,看看会发生什幺:

 

 

支持自动代码提示——它完美无缺;也支持代码未正确编写时的警告/错误,例如函数add_integers 应该返回一个整数,但它故意返回一个浮点数:

 

 

支持markdown

 

首先,将鼠标悬停在单元格上方并单击添加 Markdown 单元格:

 

 

另一种方法是单击代码下拉列表并将单元格类型切换为 Markdown。

 

下面是一些 Markdown 代码供您尝试:

 

 

这是运行单元格时的样子:

 

 

支持数据库

 

作为数据科学家,您几乎每天都必须建立和管理数据库连接。当 SQL 写成字符串时,调试很长的 SQL 行并不容易。Dataspell 有一个解决方案。以下是使用 sqlite3 包建立连接、创建数据库和表的方法:

 

 

您现在可以像往常一样插入数据:

 

 

Dataspell 的特别之处在于无需离开 IDE 或编写不必要的查询即可浏览数据库的选项。只需双击数据库,就会打开一个新的侧窗口。从那里,您可以轻松单击任何感兴趣的表格,在单独的选项卡中浏览它:

 

 

 

Be First to Comment

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注