执行长的信

 

“我们今天所做或未做的选择,可能导致崩溃,或突破至一个更绿色、更美好、更安全的未来。选择掌握在我们的手中。”

– Antὀnio Guterres, 联合国秘书长

亲爱的同事和朋友们:

我相信各位都同意,人工智慧(AI)和大型语言模型(LLM)正以加速度,将我们带入一个充满希望与激动的未来。这一发展已经对整个研究分析、机器学习及深度学习链条产生了深远影响,而最终的源头都指向了数据资源。

据网路上的估算,2024年每天产生的数据达到4.02亿TB。更具体化说明,这些数据每秒可以产生约94亿本200页的书。更深入地看,当今90%的数据是在过去两年内生成的,而其中90%又是重复数据。

无形之中,当前追求数据分析的趋势导致了前所未有的计算机、网络和存储设备的制造与消耗,而根本的因为是基于现有的思维模式都是在每次分析之前先收集数据。试想下载、存储和重复准备数据时所需的电力消耗,以及硬件制造周期。我们必须反思,这种模式是否对环境友好?

软件驱动的流程在未来同样扮演着关键角色,不仅是算法或分析功能的优劣,更关乎对我们共同的自然和文化环境的根本影响。我们确实处于历史性的十字路口。是突破还是崩溃,选择在我们手中。

我很荣幸能与各位分享我们所撰写的永续数据生态系统——Aralia的白皮书,敬请享用。

 

真挚的祝福,

 

薛文蔚 博士 
创办人兼首席执行长