在南京市“创建名城名校”以及市委、市政府“两落地、一融合”战略与政策推动下,依托南京大学软件新技术国家重点实验室,由南京大学PASA大数据实验室黄宜华教授及其团队牵头,在江北国家高新区和南京市政府大力支持下,组织成立的省级大数据技术创新企业,主要目标是将我们实验研究的关键技术落地到一个实际应用的场景当中,和具体行业做结合,把关键技术包装成一个成熟的产品。南京大学PASA大数据实验室成立于2009年,当时产业界甚至学界都没有重视这个技术领域,也很少有公司遇到了大数据问题(基本只有google)。在那个时候我们团队就开始在这个方向上投入了。在hadoop本身的完善上做了很多工作,甚至直接推出了我们自己的一版针对短作业优化的hadoop。我们普遍认为的大数据元年2013年,学界和产业界才开始注意到数据的价值以及开始使用大数据技术革新自己的软件架构。而我们早就投入了新一代大数据计算引擎spark上来了。在spark上的大量底层工作使我们有实力有自信大范围魔改spark,在2016年cloudsort公有云1TB排序大赛上获得国际冠军。当然在spark名满天下后,我们又转向了萌芽阶段的下一代大数据存储系统alluxio(初期名称tachyon)。我们是该项目最早的贡献团队之一,团队的核心成员顾荣博士是alluxio项目中国区最早的pmc,把控项目整体进展决策项目发展方向的。这仅仅是几个大例子。我们团队对大数据生态中其他技术的积累,例如NLP、图计算、自动化机器学习等领域同样是这个打法。在学界或者社区获得了很多成就。我们虽然是研究团队,但我们一直在做产业需求的观察者。很多时候能先于用户感知需求,此时我们会坚定地将之打造成可以积极响应未来产业需求的形式。更多时候是和不同行业的先进团队广泛合作,解决他们棘手的大数据问题。我们进入每个行业时都是陌生的,但我们对技术本身的理解以及对产业需求的洞察能力使我们能够很到位地理解具体的业务问题,并用最合适的方案解决。