真实数据科学
主要著作者:(美) 郁彬, (美) 丽贝卡·L.巴特著
本书主要分为三大部分。第一部分:基础概念篇。此部分将引领读者踏入实践真实数据科学的门槛,详细解析PCS框架的精髓,并对DSLC进行全面概述。同时介绍一系列计算概念,这些概念将成为读者后续实施示例和技术的坚实基石。此外,本书还将指导读者如何在计算机上高效组织数据科学项目,传授编写高效代码的经验,并助读者熟练运用Git和GitHub等开发工具。第二部分:数据准备与探索篇。在这一部分,我们将深入探讨数据清理、预处理及数据爆炸等核心议题。尽管每个数据科学项目都会涉及数据清理和预处理工作,但本书将为读者提供前所未有