中新社华盛顿12月31日电 题:新闻博物馆告别华盛顿

2019年12月31日,是位于美国首都华盛顿的新闻博物馆向公众开放的最后一天。

除了与新闻有关的实物和展品,新闻博物馆还就一些重大新闻事件开辟专题展区。人们可以在此看到“9·11”恐袭后世贸中心顶部的广播塔遗存,以及德国境外尺寸最大的柏林墙原始墙体等。

在数据科学家可以致力于减少模型所需时间的情况下,it 人员可以通过更改计算服务来做出贡献,这些服务通常通过以下一种或两种方式获得:

馆员迈克在博物馆6层的“今日头版”展区,逐一换上世界各地和全美50州代表性报纸2019年最后一天的头版报样,这项工作他已坚持了12年。换完最后一张,迈克转身与同事帕蒂·茹尔紧紧拥抱。

你需要理解深度学习:基于人脑思想的机器学习

GitHub 是个不错的选择

对于这类角色,数据科学家必须了解基于 Scrum 方法的敏捷工作方式。它为不同的人定义了不同的角色,这种角色定义保证了工作的顺利实施和持续改进。

在总共7层的展览空间里,新闻博物馆用15个展区和15个剧场,向观众呈现了美国乃至世界新闻史。第一份刊发《独立宣言》的报纸,前总统尼克松宣布辞职的《华盛顿邮报》头版,以脸书创始人扎克伯格为封面的《时代》周刊,参观者可以沿着从1492年开启的时间线,纵览500多年的新闻发展史。

Git 和 Github 是面向开发人员的软件,在管理不同版本的软件时有很大帮助。它们跟踪对代码库所做的所有更改,此外,当多个开发人员同时对同一个项目进行更改时,它们能够真正让协作变得便利。

过去几周,不少参观者特意前来与新闻博物馆道别并留言。一位美国媒体人说,新闻博物馆遭遇了纸媒衰落的困境,他祝愿该馆能以全新方式重新回归。美国民众卡伦则希望,新闻博物馆的网络展览能继续,特别是“今日头版”能以电子化的形式继续展出。

Git 是必须要掌握的技能

随着数据科学家的角色变得越来越重要,能够熟练使用这些开发工具也是必备的技能之一。Git 正成为找工作时必备的一项技能,要熟练使用 Git 需要时间。当你一个人或者你的同事都是新手的时候,开始研究 Git 是很容易的,但是当你加入一个 Git 专家团队,只有你一个人是新手的时候,你可能会经历比你想象的多得多的努力才能跟上。

2018年落成开放的新闻博物馆,是华盛顿国家广场区域为数不多的售票博物馆。站在博物馆6层,向东可远眺国会山,向南能俯瞰国家美术馆等建筑群。据报道,尽管在过去10年接待了1000万游客,但该博物馆仍未能实现盈利。

AWS 是最大的云供应商

华盛顿并不是新闻博物馆的第一处馆址。在上世纪90年代中期,该馆曾在弗吉尼亚布展多年。由于尚未找到新馆址,该馆的所有展品在新一年将被运往马里兰州的一处地点暂存。

雷锋网(公众号:雷锋网)雷锋网雷锋网

新闻博物馆当天并未举办专门的活动或仪式告别华盛顿,而是一切照旧。

大数据:它使用 Hadoop 和 Spark,这两个工具允许同时在许多计算机上并行处理任务(工作节点)。这要求数据科学家使用不同的方法来实现模型,因为代码必须允许并行执行。

与此同时,高级模型的 CPU 和 RAM 消耗也越来越大,尤其是在使用神经网络和深度学习时。

“对于华盛顿特区和美国而言,宾夕法尼亚大道都是一处充满历史意义的街区,我们不得不离开,让人感伤。”帕蒂·茹尔是该馆内容和展览开发副主管,她对中新社记者如是说。

帕蒂·茹尔说,报纸以及新闻的传播曾在美国历史上发挥了重要作用,希望观众通过展览了解新闻其实也是历史的一部分。“博物馆虽然关闭,但它的影响仍将继续。”

越来越多的数据科学家/机器学习工程师被划分为开发人员:他们的工作是不断改进现有的代码库中的机器学习相关的内容。

每天更新的“今日头版”是新闻博物馆的特色展区之一。迈克对于“最后一天”不愿多谈,他赶着把换下的旧报样送到问询台。不少参观者已在那里等待,他们希望得到来自家乡的报纸头版,留作纪念。

伯勒辛斯基说,不妨把新闻博物馆比作一场上演了近12年的新闻脱口秀,“既然是秀,就有落幕的时候”。(完)

云:将计算资源转移到外部供应商,如 AWS、Microsoft Azure 或 Google Cloud,可以很容易地建立一个可以快速从远程访问的机器学习环境。这就要求数据科学家对云功能有一个基本的了解,例如:使用远程服务器而不是自己的计算机,或者使用 Linux 而不是 Windows/Mac。

PySpark 正在为并行(大数据)系统编写 Python 代码

为 2020 年数据就业市场更新你的技能!

在数据科学领域,我们思考项目的方式也在发生变化。没有变的是,数据科学家仍然是用机器学习来回答商业问题的。但是,随着时间的发展,数据科学项目越来越多地是为生产系统开发的,例如作为大型软件中的微服务。

目前,数据科学家仍然认为 NLP 和图像识别仅仅是数据科学的专业知识,并非所有人都必须掌握。

5.NLP、神经网络与深度学习

但是,图像分类和 NLP 的用例越来越频繁,甚至在「常规」业务中也是如此。在目前的情况下,对这类技术没有基本的了解已经没办法适应当前的技术环境了。

“博物馆的大楼虽然关闭,但它的使命并未结束”,新闻博物馆主办机构负责人杰恩·伯勒辛斯基说,他们正在寻找新的馆址,并计划以更符合现代新闻业形态的方式讲述“新闻故事”,与参观者互动。

因财务状况不佳,新闻博物馆主办机构2019年初与约翰·霍普金斯大学达成协议,以3.725亿美元出售这座位于宾夕法尼亚大道555号的博物馆大楼。未来,这座建筑将被改造成一个研究生学院。

朱迪·弗妮什在新闻博物馆当了8年志愿者,她同时也是一名教授新闻课的老师。她说,新闻媒体肩负着“守望”社会的功能,新闻博物馆向公众传达了这一点,同时帮助人们学会分辨新闻报道中的客观与偏见。

敏捷开发是一种组织工作的方法,已经被开发团队大量使用。越来越多的人扮演着数据科学家的角色,他们最初的技能是纯软件开发,这就产生了机器学习工程师这一角色。

即使你的工作中没有此类模型的直接应用程序,在实际操作的项目也很容易找到。这些项目可以让你理解图像和文本项目的基本步骤。

就数据科学家的工作而言,不仅要考虑模型的准确性,还要考虑项目的执行时间或其他工业化的方面,后者正变得越来越重要。

Post-its 和敏捷开发似乎是并驾齐驱的

雷锋网版权文章,。详情见转载须知。

在机器学习产业化对数据科学家的约束越来越严重,同时,它也成为了数据工程师乃至整个 it 行业的严重约束。