graviti
产品公开数据集应用市场解决方案知识库关于我们

寻集令|酷家乐:数据让AI看见万家灯火

发布于2021-02-01

今天,云设计软件平台和SaaS服务提供商酷家乐宣布,母公司群核科技已与杭州美间科技有限公司(下称“美间”)达成最终协议,将以现金的方式,全资收购美间100%股权,该交易将在2月上旬完成。

酷家乐长期致力于为家居产业数字化升级提供一站式的解决方案。此前,酷家乐与格物钛合作,于OpenDataset公开数据集平台上线了RPLAN open dataset 和Structured3D Dataset两个数据集,丰富了户型结构和室内环境认知领域的数据集资源。

家居行业的数字化转型

酷家乐专注云设计系统及三维内容制作的技术研发和应用,面向家居、公装,地产等全空间领域,为企业级客户提供设计、营销、生产、管理、供应链等场景的解决方案和服务,赋能实现数字化升级。通过酷家乐云设计平台,用户可以完成一个房间或者一个户型的完整的三维设计。它既可以被延展到一栋别墅抑或其他建筑,也可以聚焦于家居设计。

C o o ho m

自2013年11月上线以来,酷家乐的总注册用户数已超过2500万,涵盖设计师、品牌企业、装修企业等,其中合作品牌企业数超过2万家;每日效果图渲染量超过500万张,累计渲染图总量超10亿张。酷家乐提供的在线云设计软件平台的使用场景覆盖了设计、营销、生产、施工等家居行业的全链路。

酷家乐占据家居行业头部地位的同时,更在向公装、房产等全新的领域进行拓展。在数字化、智能化方向,酷家乐推出了面向智能体的云服务解决方案,CoohomCloud。

“我们拥有高性能的即时渲染引擎,拥有基于这个引擎的三维设计工具,同时还拥有大量的数据积累以及成熟的生态、平台等等,它们形成的网络效应使得我们可以实现精准且高标注质量的三维数据合成。”CoohomCloud业务负责人付铖说到,酷家乐的技术优势是CoohomCloud这一新业务的基石。

事实上,酷家乐的核心技术包含高性能计算渲染引擎、空间认知与人工智能技术、分布式三维大数据与多媒体数字信息处理集群;在服务家居行业上下游的同时,酷家乐更是积累了超4000万的3D素材数据库。

背靠酷家乐的技术积累,CoohomCloud推出三大解决方案:人工智能解决方案上,将对大量3D场景数据进行云端人工智能算法训练,客户自己获取训练结果或中间结果;仿真模拟解决方案,为机器人行业、IOT、智能家居、AR/VR等领域搭建特定应用场景进行运动或多种传感器模拟;D2E解决方案,将规则化应用场景生成和客户自建素材导出,嵌入IOT、智能家居企业的软件工作流。

目前,CoohomCloud已经与世界顶尖的AI研究机构和服务机器人头部公司达成合作,基于酷家乐海量方案库与渲染集群的强大算力,十倍降低AI训练数据集的制作成本,极大提升AI训练数据集的制作效率,有效帮助客户以较低的预算实现智能体认知水平的极大提升。在辅助客户颠覆行业格局的同时,逐渐成长为智能体认知领域的基础设施。

开源数据集

CoohomCloud长期与国内外高校合作,在数据生成的学术领域进行探索。在已有的大量学术成果中,本次发布于OpenDataset平台的数据集,RPLANStructured3D,此前已有较大的学术影响力。其中,RPLAN数据集于2019年SIGGRAPH ASIA 上发布;Structured3D数据集于2020年 的ECCV上发布。目前,这两个数据集均免费开放给学术研究使用

RPLAN数据集包含了8万张真实存在于商用市场的户型结构图,其中不同房间和墙体的功能都已进行过功能标注。数据集中包含大量丰富的房间功能模块(a1),大小户型皆有大量的样本(a4),并且在户型房间数目上做到了多样性分布(a2)。以客厅面积这一指标为对象,在RPLAN中它形成的类正态分布(a3)也证明了整个数据集的多样性以及和真实情况的匹配程度之高。

“它很适合被用于室内路径规划和导航相关算法训练,以及户型结构分析、户型布局生成相关的学术主题。”付铖认为RPLAN数据集在特定应用场景将会发挥出很高的数据价值,“对于AR/VR、机器人行业以及智能家居领域的科研团队,RPLAN将提供巨量的训练数据支持。”

Structured3D数据集则聚焦于室内环境认知的领域。该数据集基于酷家乐专业的室内设计解决方案,包含了3500个不同的三维场景以及相应的3D结构化标注;共计2万余个房间,渲染近两百万图像,包括不同的装修配置,不同的光照,深度图,语义图。

值得强调的是,Structured3D数据集是借助酷家乐真实的渲染引擎生成的合成数据。合成数据解决了由于标注成本高昂而导致的数据集标注局限且规模普遍较少的情况,以及人工标注质量良莠不齐的现状。以全景图的房间布局任务(room layout estimation)为例,目前常用的真实场景数据集如PanoContext和Stanford-2D-3D分别只含有几百张图片,并且均假设房间结构为立方体模型(即房间由六面墙构成,且墙与墙之间相互垂直);而Structured3D无论是在数据集规模还是房间结构的多样性层面,较之都有极大的突破。

酷家乐希望Structured3D数据集能对这个既传统又新兴的研究方向有推动作用,包括但不局限于通用房间布局(general room layout estimation,即不对房间布局有任何假设)和房屋平面图(floorplan estimation)等任务。

向开源社区回馈

作为一名开源社区的受惠者和贡献者,付铖相信,开源是技术生态重要的自我优化机制。

付铖回忆14、15年自己做技术开发的经历,他将其形容为“各种轮子自己造”——在无法从外界和社区获得成熟的技术支持之时,一个开发团队只能从基础性的工作开始,从0到1地搭建整个庞大的系统。这种人力资源和时间成本的消耗,对于任何一个创业团队或者中小型公司来说都是昂贵且低效的。而现在,付铖很庆幸借助各种开源的软件和模块,大量的开发资源得以被节省。

开源对于中小型公司、团队的裨益是毋庸置疑的。了解开源社区、根据自己的情况合理地利用开源的资源,这会是中小型公司着重关注的内容;但是对于中型、大型团队,在实现资源利用的同时,如何回馈开源社区将是另一个必须提上日程的问题。来自中大型团队的项目和资源公开将是整个生态繁荣必不可缺的一环:大体量的团队分摊开发资源消耗,技术团队创业立项的门槛则同步降低,当门槛降低到一定的程度,生态整体上将获得显著的提升

在付铖看来,以酷家乐目前的量级和市场位置,它已经进入了这一阶段。制作并公开数据集,则是酷家乐对于“如何回馈开源社区”的众多回答之一。

酷家乐希望看到的是,通过在格物钛公开数据集平台OpenDataset 上的发布,在聚合平台的分发传播之下,公开数据集资源被更多国内外开发者和研究人员触达和使用。同时,开源的收益是双向的。借助OpenDataset的诸如issue等的功能模块,酷家乐能快速地接触到开发者和研究人员对数据的反馈,从开源社区中感知数据生成市场的需求和关,探索自身CoohomCloud的业务可能,在数据集定制方面做出更多的探索和实验。

RPLAN以及Structured3D数据集的公开只是酷家乐的一个初步的尝试。未来,酷家乐将面向学术需求制作更多的室内场景相关的数据集面,并在OpenDataset平台进行发布和长期运营,服务广大的开发者和研究人员社群。