人工智能实战2019_第0次个人作业_邹镇洪
Written by joezou(邹镇洪), 2019/3/4
项目 | 内容 |
---|---|
这个作业属于课程 | 人工智能实战 2019 – 北京航空航天大学 |
这个作业的要求在 | 第一次作业 介绍自己,提出课程项目建议 – 作业 – 人工智能实战 2019 |
我在这个课程的目标是 | 学会利用云部署机器学习模型并完成一个app |
这个作业在这些方面帮助我实现目标 | 了解如何开发实用项目 |
作业正文:
1. 描述你在这门课想要达到的具体目标。
- 掌握在在云上部署机器学习模型的能力。
- 部分地借助Azure或AWS完成一个实用app。
- 提高团队合作coding的能力。
2. 描述你学过什么计算机语言, 代码量大约是多少行。我们这次课程主要用 Python 语言, 请抓紧时间自学或巩固你的Python 知识。
- Python:代码20k+行,主要包括一个关于商品推荐的项目。
- C:代码约4k行,主要是数值分析作业。
3. 如果你要和另外 4 – 5 名同学一起做一个小的 AI 项目,你有什么想法,请描述一下。请按照这个 NABCD 格式来写你的项目建议。
我的构想项目是辅助视觉系统,以下是NABCD内容:
1) N (Need 需求)
对于视障人员而言,目前主要辅助工具为导盲犬、陪护人员等具备视力的生物,但无疑这些服务均需要一定成本和时间进行培养,且仍在许多情况下不适用,比如导盲犬无法于盲人进行充分的信息交流、陪护人员难以做到终生陪伴等。对于如夜晚等弱视环境而言,视觉辅助系统,如夜视镜,也有着重要的工程应用。于此同时,各种视觉辅助穿戴设备不断涌现,如谷歌眼镜等,说明这里有一定的市场,而在计算视觉和自然语言处理技术的加持下它会发展得更好。
2) A (Approach 做法)
计划分三部分达成,其中第2部分在3-5年达成内较为现实:
- 提高微型计算机计算能力
主要通过提高传感器精度和计算机实时图像处理能力达成,尤其是后者,需要解决当前CV和NLP技术在小规模机器(眼睛搭载单片机)上以低能耗高速计算的能力,以及高能小型电池的研发。但还有一个替代方案,如果日后5G通信和物联网技术发展充分,也可以借助街道摄像头获取街景数据,眼睛负责近距离图像,而数据全部上传云端,云端模型完成训练后传回本地,好处是可以通过云端的机器数量冗余来暴力实现高速实时处理,特别适用于限制范围的场景,如实景游戏。- 搭建video to text模型
现有算法专注于文本理解、视频实体识别、视频分类等基本步骤,这些步骤的组合可以搭建一个粗糙的video to text模型,但该模型的复杂度过高,我们希望可以构建全新的end to end模型,并希望输出为“自然对画面的动态描述”而不是“机械地描述客观环境状态”,以模拟真人的对话效果。- 实景测试并逐步推向市场
按科学实验->康复医疗->工地应用->市场娱乐的步骤逐步开发产品,从医疗入手是因为医疗领域的需求最硬且对产品功能多样化要求最低,最后进军娱乐是因为娱乐市场对产品体验要求最高,过早投入面临较高的冷场风险。
3) B (Benefit 好处)
无疑,当前没有任何一款设备可以帮助视障患者恢复视觉,当前视觉辅助产品也仅限于雷达和红外探测等初级感知智能,无法适用于复杂的生活实景,也无法于用户进行充分的信息交流,如浙大在2017年的视觉辅助系统。这款产品将为用户带来全新的体验,在较大程度上让盲人获取外部视觉信息。
但无疑,在当先微机计算能力、电池技术、人工智能技术和移动通信水平下,5年内仍看不到实现的可能,且产品在早期必然价格不菲。目前有可能实现的仅有第2部分。
但我相信这是一项重要的穿戴产品,随着计算机视觉技术和智能眼睛技术的发展终将出现,因此早期的技术累计是必要的。
4) C (Competitors 竞争)
产品竞争:现有的初级视觉辅助系统和AR设备(游戏领域);未来的脑机智能设备(直接与脑电信号交流)
当前技术竞争:各大CV公司的视频理解技术均为强大竞争,国内主要是字节跳动、BAT,自动驾驶厂商也构成部分竞争。
5) D (Delivery 交付, Data 数据)
交付:已在A中阐述,先从医疗合作入手。
数据:未进行调研,目前国内仅有浙大一家开发了盲人辅助视觉系统,2017年获得600万美元融资,估计竞争较少是技术问题。