2015年,我国服装网购市场交易规模达到7457亿元,时尚领域逐渐从线下走到线上。对于企业和设计师,设计出更符合时尚潮流、更具吸引力的产品是首要目标;而对于消费者,如何挑选并搭配出最适合自己的产品则是他们关注的重点。在这种情况下,时尚分析应运而生。
时尚分析的主要目标是对人像图片中的服饰、发型、配饰等元素以及整体时尚潮流进行分析。当人工智能尤其是计算机视觉技术出现后,时尚分析领域的发展出现了新的可能与机遇。
辅助设计与潮流分析预测
随着人工智能技术的不断发展,时装设计师们在设计服装时有了更多的选择和助力。例如,通过神经网络模型的训练,人工智能技术可以在一定程度上辅助时装设计师进行工作。2016年,谷歌与德国电商Zalando合作,开发了一款人工智能时装设计产品Project Muze。该产品基于TensorFlow平台,收集了600多位设计师的色彩、材质、风格等设计信息,再利用神经网络进行训练,最终实现了只须询问用户几个问题就能设计出一套符合用户偏好的时装的功能。图1展示了Project Muze智能化设计服装的效果。受限于模型的能力与时装设计任务的复杂程度以及时尚评判的主观性,该产品的设计效果还不理想,但是在未来,它仍然有可能成为设计师的最佳助手,更有效地激发他们的灵感,并通过其非人工服务的特点极大程度地降低消费者享受个性化服务的成本。
图1 人工智能时装设计产品Project Muze效果图
虽然人工智能完全取代设计师还不太现实,但是在人工智能技术的协助下,设计师能够从大量的时尚数据中很快地挖掘出符合其设计理念的时尚元素,并结合市场与顾客需求,高效地进行产品设计。2016年,在中国版VOGUE1十一周年庆典上,歌手李宇春出席典礼时,身穿的就是设计师张卉山利用IBM Watson2认知技术辅助设计而成的礼服。在设计过程中,Watson在短短一周内阅读了上百万条来源于社交媒体的图片及文字,从而帮助设计师更好地了解设计对象的时尚特质,然后Watson根据设计师的构思,从50万张经典图片里识别出礼服的时尚元素,并最终推荐了2500张图片供设计师参考。如果没有人工智能技术的帮忙,设计师可能需要大量的时间人工完成这个过程,而由于Watson 给出了符合个性化设计需求的建议,这个过程被缩减到一周[1]。
人工智能技术还可以预测时尚潮流。例如,在2017国际计算机视觉大会(ICCV 2017)上,德克萨斯大学奥斯汀分校克里斯汀·格劳曼(Kristen Grauman)课题组发表了基于深度学习技术的时尚潮流分析研究成果“Fashion Forward: Forecasting Visual Style in Fashion”。该文提出,利用神经网络对服装图片的语义分类功能,结合非负数矩阵分解,可以预测未来时尚的走势,发掘时尚的周期状态。图2(左)表示了两种不同的时尚风格,(右)是对两种风格的流行趋势预测。
图2 Fashion Forward中时尚预测示意图
时尚购物辅助——搜索、推荐与试穿
时尚搜索类似于以图搜图,即给定一张商品图片,通过特定算法搜索到同款商品。与普通的以图搜图功能相比,时尚搜索需要针对时尚领域这个特殊场景,在算法上进行相应调整。由于服装更关注颜色、材质、款式、风格等特征,同时又具有柔软易变形、视觉角度多样等特点,传统的相似图片搜索不能很好地满足需求。香港中文大学Multimedia Laboratory团队在2016国际计算机视觉与模式识别会议(CVPR 2016)发表了服饰搜索算法Deep Fashion。文章罗列了多种实际场景下的服饰搜索应用,包括用户拍摄图片与在线服饰之间的搜索以及在线服饰之间的相互搜索。作者发布的数据库包含了80万张图片,这些图片都标注了服饰属性,以及用户拍摄图片与在线服饰之间的对应关系,同时提出了一套名为FashionNet的解决方案。该方案首先预测了时尚关键点,基于这些关键点提取的深度特征能够很好地区分服饰属性,从而实现较好的服饰图片搜索效果。图3展示了Deep Fashion是如何提取特征点并实现相似服饰搜索功能的。
图3 Deep Fashion中服饰搜索功能示意图
图4 Magic Closet中服饰推荐功能示意图
目前,关于各种商品的推荐系统屡见不鲜,最常见的是网站根据用户的浏览足迹或消费记录进行商品推荐,但是对于时尚领域,这些功能不足以满足用户的需求。基于消费记录的推荐常常会造成某种困境,即在用户已经购买某件商品后系统还在继续推荐此类商品,制造了冗余而重复的推荐。优秀的时尚推荐应满足:既能按照用户的偏好推荐相似商品,又能按照穿搭规则(dressing code)推荐商品,比如对于给定的上衣,搭配合适的裤子、裙子、鞋子甚至饰品等。具体方法有很多,例如,通过采集用户日常风格、穿着场合等信息进行服装购买与搭配的推荐,或者通过收集用户的个人偏好、购物及收藏记录等,帮助用户找到适合的产品。相关的代表性研究工作是新加坡国立大学Learning & Vision 组的“Hi, Magic Closet, Tell Me What to Wear!”。该工作获得了2012国际多媒体会议(ACM MM 2012)的最佳技术展示奖。它利用Latent SVM 模型,训练了一套针对9种场景的服饰推荐模型,该模型主要有两个特点:第一,与场景相关。例如针对“开会”场景,推荐的服饰更加正式;针对“运动”场景,推荐的服饰更加轻便。第二,会考虑衣服和裤子的搭配。比如,从审美角度,红色的衣服不宜搭配绿色的裤子。通过丰富而详细的规则,该模型很好地完成了具有独特领域特色的服饰推荐任务。图4展示了这项工作的具体功能与工作流程。
图5 虚拟试穿功能示意图
线上购买时尚产品时,消费者只能通过图片进行挑选而无法实际试穿,这往往使其在购物时犹豫不决。因此,实现线上虚拟试穿成为线上购物的迫切需求。同时,如果线下购物也能实现虚拟试穿功能,则可以为商家节约大量人力、资金成本,消费者也能够免去繁琐的换装过程,节约宝贵的购物时间。人工智能技术的发展正好为这个功能的实现带来了可能,通过计算机视觉领域中的人体关键点检测,人体与服装图像分割,相应的图像变换以及合成技术,用户通过摄像头就可以将自身影像上传至线上,从而在虚拟的空间中实现试穿功能(见图5)。
关键技术难点
无论是时装设计还是线上的消费辅助功能,计算机视觉技术在时尚领域的应用通常会用到关键点检测、人体解析与属性分类三大技术。了解这些技术的应用,有助于我们更好地理解计算机视觉在时尚领域中所能发挥的作用以及它的实现原理。
关键点检测是指定位图片中目标物体的几个特殊点的位置。在搜索或推荐任务中,需要得到目标的关键点,从而进行合理的特征提取以获得目标的语义信息,而在时尚设计或试穿任务中,同样需要关键点信息使得对目标的定位更加精准。香港中文大学MMLab团队发表于2016欧洲计算机视觉国际会议(ECCV 2016)的“Fashion Landmark Detection in the Wild”工作,定义了8个时尚关键点,包括左领、右领、袖子、下摆、腰线等,并提出了一套能够准确地预测这些关键点的算法。同时,作者还公布了一套实验中用到的数据库Deep Fashion,促进了相关的研究。
图6 人体图像解析示意图
图7 Street to shop中对时尚属性的定义
人体解析就是人体与服饰领域的图像语义分割任务(Image semantic segmentation),但它更加精细,而且重点关注的对象是人。图6是通过对人体的解析,特别是对各种服饰的分割,计算机生成的精确至像素级的分割结果。利用这些结果对图片进行理解,从而更好地完成更高层的应用。
属性分类是最基础也是应用最广泛的计算机视觉技术,各种属性分类技术在业界巨头和创业公司都得到了广泛应用。在时尚场景中,时尚属性是由新加坡国立大学Learning & Vision团队在CVPR 2012的口头报告论文“Street-to-shop: Cross-scenario Clothing Retrieval via Parts Alignment and Auxiliary Set”中首次明确定义的,图7展示了时尚属性的具体定义。该论文中的方法首先估计人的身体部件(如肩部、手臂等)的位置,然后在对应的区域上提取特征,实现图像搜索。此方法在跨场景搜索的实际应用中取得了很好的效果。
总结及展望
在电商和时尚媒体等实际应用的驱动下,时尚分析领域发展很快。基于关键点检测、人体解析以及属性分类的中间结果,很多更高层的实际应用已不再遥不可及,时尚搜索已经成功地在淘宝和京东落地。而时尚推荐、时尚挖掘以及时尚预测都是时尚分析领域的热门应用,具有颇高的理论研究价值。依托人工智能尤其是计算机视觉技术的发展,将充足的数据与高性能的深度学习算法相结合,许多原本难以实现的服务将逐渐变为现实,在未来,人工智能技术将在时尚领域中扮演更加重要的角色。 ■
脚注:
1 VOGUE是由美国康泰纳仕集团出版发行的一本期刊,创刊于1892年。中国版VOGUE——《VOGUE服饰与美容》于2005年9月正式在中国创刊。
2 IBM Watson是认知计算系统的杰出代表,也是一个技术平台。认知计算代表一种全新的计算模式,它包含信息分析,自然语言处理和机器学习领域的大量技术创新,能够助力决策者从大量非结构化数据中揭示非凡的洞察。
参考文献:
[1] 探索时尚的另一种可能性:人工智能[OL]. http://www.jiemian.com/article/978611.html.
所有评论仅代表网友意见