> 反复体会:程序=数据结构+算法。 去年年底在即刻上发了上面这句话,现在来用案例解释一下吧。因为,我之前隐隐担心的东西出现了:Excel + Python。 在以飞书多维表格为代表的新一代 spreadsheet 产品刚刚出现的时候(见我 19年就在用但20年才写了博文 [[Eureka · A Better Spreadsheet]] Airtable),它们都还比较粗糙,性能上似乎也有点问题。但是性能这种问题,放在以10年为单位的尺度上看,是不存在什么问题的了。飞书不久前就把多维表格的数据量上线提上去了。于是,在 OLTP 侧的应用可以真的起步了。 作为一个不老但是老道的 BI 工程师,我最讨厌的就是中国式报表。人人都在用,但是没有一个产品好用的。大概是2021年的时候,我隐隐看到了新一代 spreadsheet 在 OLAP 侧的雏形:以 excel-online 类型的电子表格(一定是在线版)为数据的“载体”,借用 excel 已有的图表、参数和单元格计算能力,外拓一个计算引擎。可惜我缺乏技术能力来验证这个事情。 如果只是这样说出来,其实创新性不大。excel add-ons 的插件,是可以实现类似的事情的。但是,add-ons 是外加在电子表格上的。如果电子表格变成一个 add-on ,或者电子表格和外拓的计算引擎是互为 add-on 的关系呢? 先看看几个视频截图。更多视频可以去看 https://youtube.com/playlist?list=PL6oXAzzeKAHeEj6csfyI6iuGQTO1H5Ok4&si=KhtXJUxKmeD3lloP 这个 list。 #### excel + python 视频截图 一年前,我说这种话,研发会“打我”的。现在我敢说了,我可以拿着 MS 家的成品给你看。(microsoft 大概是 1年前发布的这个功能,realse note https://techcommunity.microsoft.com/t5/excel-blog/what-s-new-in-excel-september-2023/ba-p/3915215 我在截图里配了字,可以放大阅读。 ![[Greater Spreadsheet - Excel + Python20240929151412.png]] ![[Greater Spreadsheet - Excel + Python20240929151514.png]] ![[Greater Spreadsheet - Excel + Python20240929151638.png]] ![[Greater Spreadsheet - Excel + Python20240929151821.png]] #### 叹 我还没机会真的上手体验。从上面的 demo 来看,并不是吹水的假功能,至少是有实际价值的功能。 虽然目前: - 从效果上说,好像只是用 excel 作为 pandas 的前端页面来使用。 - 从功能上说,似乎 MS 是为了吃到大模型 copliot 在 python 代码生成上的红利。这波红利必须吃的原因也很直白:excel 内部的程序调用难以让大模型做;统计模型和机器学习模型,python 是事实标准语言;excel 难以做大型数据集的这样密集的计算,但是开一个口子互通有无,简直不要难度低太多。 在做[[产品 remix]]上,微软的成效还是突出的。把开源社区的东西,狠狠地学习到自己的产品里,成为非常有机的一部分,然后把自己的股价做了上去。 怎么说呢?消费电子盯苹果,办公软件盯微软。