绿云&高质量数据集
2025 GREENCLOUD
近日,杭州市高质量数据集建设“揭榜挂帅”项目公布首批入围名单,由杭州绿云科技有限公司牵头,联合脉策科技、优数云旅共同申报的 “城市酒店Citywalk高质量数据集” 成功入选,成为杭州国家语料库先行先试项目之一。
杭州国家语料库是杭州市为促进人工智能产业发展、构建“数据-算力-模型”一体化生态而推进的重要数据基础设施,旨在汇聚高质量、多模态数据集,为大模型训练提供易获取、规模化、低成本的优质语料资源。本次“揭榜挂帅”机制覆盖医疗健康、文化旅游、工业制造等14个新兴产业领域,旨在鼓励企业结合真实场景推进数据合规建设与价值转化,打造具有杭州辨识度的标杆案例。
绿云牵头构建的数据集围绕城市文旅与酒店场景深度融合,以多模态形式整合文本、图像、音频、视频等数据,聚焦Citywalk主题线路与文化讲解,致力于为酒店宾客提供在地化、沉浸式的文旅体验,助力服务业数字化升级。目前,该数据集已支持豆包、Kimi、通义千问等多个主流大模型,具备持续更新与高质量治理能力。
此次入选,不仅是绿云在“数据+AI+场景”融合创新方面获得的重要认可,也标志着公司在参与公共数据基础设施建设、赋能行业智能化转型方面迈出关键一步。未来,绿云将持续深化数据能力,推动文旅数字生态构建,为“中国数谷”发展和人工智能产业应用注入新动力。