6月27日,国内高校最大的云上科研智算平台CFFF(Computing for the Future at Fudan)在复旦大学正式上线。这台为发现和解决复杂科学问题而建的科研“超级计算机”由复旦大学与阿里云、中国电信共同打造,以公共云模式提供超千卡并行智能计算,支持千亿参数的大模型训练。
根据此前的招投标公告,CFFF专用计算平台的整体系统组成如下:集群系统包含登录管理节点、高性能超级计算机(包括GPU计算节点-前期已购置和本次购置的、CPU计算节点、胖节点、国产CPU计算集群和超融合集群)等计算设备、存储系统(包括高速存储系统-全闪、混闪-和低速存储系统-温存、磁带库)、网络系统(包括高速计算网络、管理业务网络、带外管理网络、校内网对接网络),虚拟机系统、安全设备、集群统一管理、集群统一登录门户网站、作业调度系统、并行开发环境等全套软硬件,机房托管,跨校区大数据传输网系统等。
据介绍,部署在复旦校内的“近思”一号是专用高性能计算集群,托管在1500公里外阿里云乌兰察布数据中心的“切问”一号将面向多学科融合创新的AI for Science。
目前,CFFF平台上的第一个科研成果已经诞生。复旦大学人工智能创新与产业研究院李昊团队近期发布了45亿参数量的中短期天气预报大模型,预测效果在公开数据集上首次达到业界公认的ECMWF(欧洲中期天气预报中心)集合平均水平,并将预测速度从原来的小时级缩短到了3秒内。“基于CFFF平台的千卡并行智能计算,这样一个规模的大模型只用一天就完成了训练。传统的计算平台是很难做到的。”李昊说。
“随着大数据资源的不断增长,随着需要求解的科学问题日益