深入学习Fastai和Pytorch的编码器:AI应用程序没有博士 - 这本书和课程

欢迎来到 对编码人员的实践深度学习。该网站涵盖了这本书和2020年版的课程,旨在紧密合作。如果你还没有拿到这本书,你可以 在这里买 。这也是 自由用 作为互动Jupyter笔记本;阅读以了解如何访问它们..

我如何开始?

如果您现在准备好潜入,这里是如何开始的。如果您想了解更多关于本课程的信息,请阅读下一节,然后在此回来。

要观看视频,请单击 课程 导航侧栏的部分。课程都有可搜索的成绩单;单击右上面板中的“抄本搜索”以搜索单词或短语,然后单击它将直接跳转到签名中出现的视频。这些视频都是标题,也翻译成中文(简体中文)和西班牙语;在观看视频时,单击“CC”按钮以打开和关闭它们,并设置按钮更改语言。

每个视频都涵盖了书中的一章。本书的整个章节都可以作为互动Jupyter笔记本提供。 jupyter笔记本 是有充分理由在Python中做数据科学的最受欢迎的工具。它功能强大,灵活,易于使用。我们认为你会喜欢它!由于学习深度学习的最重要的是编写代码和实验,因此您有一个很好的实验代码的平台。

要开始,我们建议您从推荐的在线平台中使用Jupyter服务器(单击链接有关如何在课程中使用这些的说明):

  • COLAB. :Google的流行服务。谷歌已经改变了笔记本平台很多,所以键盘快捷键是不同的,而不是一切都有效(例如,第2章的大部分不起作用,因为Colab不支持创建Web App Guis)
  • 坡度 :与Colab不同,这是一个“真正的”Jupyter笔记本,所以课程中的一切都在作品中。它还提供保存笔记本和型号的空间。但是,有时免费服务器被过度加载,并且当发生这种情况时,无法连接。

如果您对运行完整Linux服务器的经验感兴趣,可以考虑 datacrunch.io. (非常新的服务,所以我们不知道它有多好,没有设置所需,非常好的价值和极快的GPU),或者 谷歌云 (非常热门的服务,非常可靠,但最快的GPU更昂贵)。我们强烈建议使用推荐的在线平台之一来运行笔记本电脑,以及 不是 使用您自己的计算机,除非您对Linux系统管理和处理GPU驱动程序,CUDA等,否则您非常经验丰富。

如果你需要帮助,有一个 精彩的在线社区 准备在论坛上帮助您.Fast.ai。在询问论坛上的问题之前,请仔细搜索以查看您的问题是否已被解答。 (论坛系统不会让您发布,直到您在网站上花了几分钟的网站读取现有主题。)许多学生发现棘手的一点是在第2课中为图像下载任务注册了棘手的比例;这是一个乐于助人的 论坛帖子 解释如何获取Bing API键,您需要下载图像。

这课程是我的吗?

谢谢你让我们加入你的深入学习之旅,但是你可能是遥远!以前的快速课程已被数十万名学生从世界各地的各界人士研究。许多学生告诉我们他们是如何成为的 多个金牌获奖者国际机器学习比赛, 收到的优惠 来自顶级公司,并拥有 研究 文件 发表 。例如,Isaac Dimitrovsky 告诉我们 that he had "在没有真正的几年里,在没有笨拙的时间里玩过...... [那么]去年年底前后一部分,它点击了我“。他继续在盛名的国际上实现第一名 ra2-梦想挑战 竞赛!他开发了一个 多级深度学习方法 用于评分射线照相手中的类风湿性关节炎,利用Fastai图书馆。

如果你没有来自技术或数学背景(虽然如果你也这样也没关系!);我们写了这门课程,使尽可能多的人提供深入的学习。唯一的先决条件是你知道如何代码(一年的经验就足够),最好是在Python中,并且您至少遵循了高中数学课程。前三章已经明确编写,以允许高管,产品经理等来了解他们需要了解深度学习的最重要的事情 - 如果是的话,只需跳过这些部分中的代码。

深度学习是一种计算机技术,用于提取和转换数据 - 使用案例从人类语音识别到动物图像分类 - 通过使用多层神经网络。很多人都认为你需要各种各样的难以找到的东西来获得极大的学习结果,但就像你在本课程中看到的那样,那些人错了。这是你的几件事 绝对不需要 做世界级的深度学习:

神话(不需要) 真相
很多数学 只是高中数学就足够了
很多数据 我们已经看到了录制的结果<50 items of data
很多昂贵的电脑 您可以获得最先进的最先进的工作所需的内容

深度学习具有权力,灵活性和简单性。这就是为什么我们认为应该在许多学科中应用。其中包括社会和物理科学,艺术,医学,金融,科学研究等等。以下是深度学习或使用深度学习的不同领域的数以千计的任务列表,现在是世界上最好的:

  • 自然语言处理(NLP) 回答问题;语音识别;概述文件;分类文件;在文件中查找名称,日期等;搜索提到概念的文章
  • 计算机视觉 卫星和无人机图像解释(例如,灾难恢复力);人脸识别;图像标题;阅读交通标志;在自动车辆中定位行人和车辆
  • 药物 在放射学图像中寻找异常,包括CT,MRI和X射线图像;计数病理幻灯片中的特征;超声中测量特征;诊断糖尿病视网膜病变
  • 生物学 折叠蛋白;分类蛋白质;许多基因组学任务,如肿瘤正常测序和分类临床可行的遗传突变;细胞分类;分析蛋白质/蛋白质相互作用
  • 图像生成 彩色图像;增加图像分辨率;从图像中删除噪声;将图像转换为着名艺术家风格的艺术
  • 推荐系统 网络搜索;产品建议;主页布局
  • 玩游戏 国际象棋,去,大多数Atari视频游戏,以及许多实时战略游戏
  • 机器人 处理有挑战性的物体,以定位(例如,透明,有光泽,缺乏质地)或难以接受
  • 其他应用程序 财务和后勤预测,言论文本,还有更多...

我们是谁

我们是Sylvain Gugger和Jeremy Howard,您在这段旅程中的指南。我们是FastAi的共同作者,该软件将在整个课程中使用。

Jeremy一直在使用和教学机器学习左右30年。他25年前开始使用神经网络。在此期间,他领导了许多公司和项目,这些公司和项目在他们的核心上学习,包括建立第一家专注于深入学习和医学,善于主席和主席和主席科学家的核心的公司社区,卡格。他是联合创始人,以及瑞士·托马斯博士,快速。该课程建立课程的组织是基于的。

Sylvain已经写了10个数学教科书,涵盖了整个先进的法国数学课程!他现在是一名拥抱脸的研究员,以前是一名高级研究员。

我们关心教学。在本课程中,我们首先展示如何使用完整,工作,非常可用,最先进的深度学习网络来解决现实世界问题,使用简单的表现力的工具来解决现实世界问题。然后我们逐渐深入地深入了解这些工具的制作方式以及如何制作这些工具的工具,等等......我们总是通过示例教授。我们确保有一个语境和您可以直观地理解的目的,而不是从代数符号操纵开始。

您将使用的软件

在本课程中,您将使用 Pytorch. Fastai. .

我们使用数十种不同的包装完成了数百个机器学习项目,以及许多不同的编程语言。在Fast.ai,我们使用了今天使用的大部分主要深度学习和机器学习套餐的书面课程。在决定我们将在未来的课程,软件开发和研究中使用它之前,我们花了超过一千小时的测试Pytorch。 Pytorch现在是世界上增长最快的深度学习图书馆,已经在顶级会议上用于大多数研究论文。

Pytorch最适用于一个低级基础库,为更高级别的功能提供基本操作。 FastAi库是最流行的库,用于在Pytorch之上添加此更高级别的功能。在本课程中,随着我们更深入地进入深度学习的基础,我们也将深入进入Fastai的层。本课程涵盖了FastAi库的版本2,它是来自临时重写提供许多独特功能。

你会学到什么

完成本课程后,您会知道:

  • 如何培训实现最先进结果的模型:
    • 计算机愿景,包括图像分类(例如,通过品种分类宠物照片),以及图像定位和检测(例如,发现图像中的动物在哪里)
    • 自然语言处理(NLP),包括文档分类(例如,电影审查情绪分析)和语言建模
    • 具有分类数据,连续数据和混合数据的表格数据(例如,销售预测),包括时间序列
    • 协作过滤(例如,电影推荐)
  • 如何将模型转换为Web应用程序,并部署它们
  • 为什么和深度学习模型如何工作,以及如何使用该知识来提高模型的准确性,速度和可靠性
  • 最新的深度学习技巧真正在实践中
  • 如何实施随机梯度下降和从头开始的完整训练循环
  • 如何考虑您的工作的道德含义,以帮助确保您让世界成为一个更好的地方,您的工作并不滥用伤害

以下是一些覆盖的技术(如果这些话都不担心,但尚未对您有任何意义 - 你会很快学习它们):

  • 随机森林和渐变提升
  • 仿射函数和非线性
  • 参数和激活
  • 随机初始化和转移学习
  • SGD,势头,亚当和其他优化器
  • 批量归一化
  • 退出
  • 数据增强
  • 重量腐烂
  • 图像分类和回归
  • 实体和Word Embeddings
  • 经常性神经网络(RNNS)
  • 分割
  • 以及更多