注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)工業(yè)技術(shù)一般工業(yè)技術(shù)Python機(jī)器學(xué)習(xí)工程實(shí)戰(zhàn)(第2版)

Python機(jī)器學(xué)習(xí)工程實(shí)戰(zhàn)(第2版)

Python機(jī)器學(xué)習(xí)工程實(shí)戰(zhàn)(第2版)

定 價(jià):¥198.00

作 者: (美)Andrew Mcmahon(彼得·麥克馬洪)
出版社: 電子工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買這本書可以去


ISBN: 9787121500169 出版時(shí)間: 2025-04-01 包裝: 平塑勒
開本: 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書是一本面向機(jī)器學(xué)習(xí)實(shí)務(wù)的專業(yè)指南,通過系統(tǒng)化的工程學(xué)視角幫助讀者將機(jī)器學(xué)習(xí)理論轉(zhuǎn)化為實(shí)際應(yīng)用。全書共九章。內(nèi)容從基礎(chǔ)知識(shí)到模型標(biāo)準(zhǔn)化、部署模式、擴(kuò)展規(guī)模及深度學(xué)習(xí)應(yīng)用,層層深入,逐步構(gòu)建機(jī)器學(xué)習(xí)工程的完整知識(shí)體系。書中特別強(qiáng)調(diào)如何在Python中高效編碼與設(shè)計(jì),如何在大規(guī)模數(shù)據(jù)集上開發(fā),以及當(dāng)下熱門的大型語言模型(LLM)構(gòu)建與運(yùn)營(yíng)方法。本書不僅傳播技術(shù),更傳遞了工程學(xué)的嚴(yán)謹(jǐn)與實(shí)踐精神,旨在培養(yǎng)能夠解決復(fù)雜技術(shù)問題并引領(lǐng)數(shù)據(jù)科學(xué)發(fā)展的專業(yè)人才。無論是初學(xué)者,還是行業(yè)從業(yè)者,本書對(duì)讀者來說都是一次深入機(jī)器學(xué)習(xí)工程的寶貴探索。

作者簡(jiǎn)介

  Andrew McMahon(彼得·麥克馬洪),多年來在多個(gè)行業(yè)中構(gòu)建了具有高影響力的機(jī)器學(xué)習(xí)產(chǎn)品。他目前擔(dān)任英國(guó)NatWest集團(tuán)的首席MLOps工程師,并擁有倫敦帝國(guó)理工學(xué)院理論凝聚態(tài)物理博士學(xué)位。他是一位活躍的博主、演講者、播客嘉賓,并在MLOps社區(qū)中擔(dān)任領(lǐng)導(dǎo)角色。他是AI Right播客的聯(lián)合主持人,并榮獲2022年英國(guó)數(shù)據(jù)獎(jiǎng)“年度新星”和2019年數(shù)據(jù)科學(xué)基金會(huì)頒發(fā)的“年度數(shù)據(jù)科學(xué)家”稱號(hào)。Andrew P. McMahon多年來在多個(gè)行業(yè)中構(gòu)建了具有高影響力的機(jī)器學(xué)習(xí)產(chǎn)品。目前,他擔(dān)任英國(guó)NatWest集團(tuán)的首席MLOps工程師,并擁有倫敦帝國(guó)理工學(xué)院理論凝聚態(tài)物理博士學(xué)位。他是一位活躍的博主、演講者、播客嘉賓,并在MLOps社區(qū)擔(dān)任領(lǐng)導(dǎo)角色。他是AI Right播客的聯(lián)合主持人,并榮獲2022年英國(guó)數(shù)據(jù)獎(jiǎng)“年度新星”和2019年數(shù)據(jù)科學(xué)基金會(huì)頒發(fā)的“年度數(shù)據(jù)科學(xué)家”稱號(hào)。譯者:殷海英,從2013年底開始在美國(guó)大學(xué)作為客座教授,主持?jǐn)?shù)據(jù)分析與數(shù)據(jù)科學(xué)項(xiàng)目的研究生研修班,截止2021年已經(jīng)開辦近20期,培訓(xùn)來自世界多個(gè)國(guó)家的數(shù)百名碩士(含博士)研究生。并獨(dú)立編寫數(shù)據(jù)分析與數(shù)據(jù)科學(xué)教材,并設(shè)計(jì)多版實(shí)訓(xùn)教程。在甲骨文公司,作為亞太區(qū)的數(shù)據(jù)科學(xué)家參與Oracle數(shù)據(jù)科學(xué)產(chǎn)品的研發(fā)與推廣。近期的主要研究方向?yàn)闄C(jī)器視覺與高性能運(yùn)算在現(xiàn)實(shí)當(dāng)中的應(yīng)用。作為甲骨文公司官方媒體的管理員及編輯,從2016年起編寫并發(fā)表近100篇技術(shù)文章,涵蓋數(shù)據(jù)庫(kù)技術(shù)、數(shù)據(jù)科學(xué)以及機(jī)器視覺等方面。

圖書目錄

第1章 機(jī)器學(xué)習(xí)工程簡(jiǎn)介 1
技術(shù)要求 2
定義數(shù)據(jù)學(xué)科的分類 4
數(shù)據(jù)科學(xué)家 4
機(jī)器學(xué)習(xí)工程師 5
機(jī)器學(xué)習(xí)運(yùn)維工程師 6
數(shù)據(jù)工程師 8
作為一個(gè)高效的團(tuán)隊(duì)進(jìn)行協(xié)作 8
在現(xiàn)實(shí)世界中的機(jī)器學(xué)習(xí)工程 9
什么是機(jī)器學(xué)習(xí)解決方案? 12
為什么使用Python? 14
機(jī)器學(xué)習(xí)系統(tǒng)的高層設(shè)計(jì) 14
示例1:批量異常檢測(cè)服務(wù) 15
示例2:預(yù)測(cè)API 21
示例3:分類流程 26
本章小結(jié) 30
第2章 機(jī)器學(xué)習(xí)開發(fā)流程 32
技術(shù)要求 33
配置我們的工具 34
設(shè)置AWS賬戶 38
從概念到解決方案的四個(gè)步驟 39
將這與CRISP-DM進(jìn)行比較 41
發(fā)現(xiàn) 42
使用用戶故事 43
運(yùn)行 45
開發(fā) 46
部署 63
了解你的部署選項(xiàng) 63
理解DevOps和MLOps 65
使用GitHub Actions構(gòu)建第一個(gè)CI/CD示例 68
持續(xù)模型性能測(cè)試 72
持續(xù)模型訓(xùn)練 74
本章小結(jié) 76
第3章 從模型到模型工廠 78
技術(shù)要求 79
定義模型工廠 80
掌握學(xué)習(xí)的方法 81
定義目標(biāo) 81
減小損失 82
準(zhǔn)備數(shù)據(jù) 83
為機(jī)器學(xué)習(xí)設(shè)計(jì)特征工程 84
設(shè)計(jì)分類特征工程 84
設(shè)計(jì)數(shù)值特征工程 86
設(shè)計(jì)訓(xùn)練系統(tǒng) 89
訓(xùn)練-系統(tǒng)設(shè)計(jì)選項(xiàng) 90
訓(xùn)練-運(yùn)行模式 91
訓(xùn)練-持久化 92
模型重訓(xùn)練 93
檢測(cè)數(shù)據(jù)漂移 95
檢測(cè)概念漂移 98
設(shè)置限制 100
診斷漂移 101
修正數(shù)據(jù)漂移 103
其他監(jiān)控工具 105
自動(dòng)訓(xùn)練 109
自動(dòng)化的層次結(jié)構(gòu) 109
優(yōu)化超參數(shù) 111
AutoML 118
持久化你的模型 121
構(gòu)建模型工廠與管道 125
Scikit-learn管道 126
Spark ML管道 130
本章小結(jié) 133
第4章 打包封裝 135
技術(shù)要求 136
編寫優(yōu)秀的Python代碼 136
回顧基礎(chǔ)知識(shí) 137
訣竅與技巧 139
堅(jiān)持標(biāo)準(zhǔn) 142
編寫高質(zhì)量的PySpark代碼 144
選擇風(fēng)格 145
面向?qū)ο缶幊?145
函數(shù)式編程 148
打包你的代碼 150
為什么要打包? 151
選擇打包的用例 152
設(shè)計(jì)你的包 153
構(gòu)建你自己的包 158
使用Makefile管理你的環(huán)境 160
使用Poetry進(jìn)行打包 165
測(cè)試、日志記錄、安全性和錯(cuò)誤處理 170
測(cè)試 170
保護(hù)你的解決方案 174
分析自己的代碼以發(fā)現(xiàn)安全問題 175
分析依賴項(xiàng)以發(fā)現(xiàn)安全問題 177
記錄日志 180
錯(cuò)誤處理 183
不要重復(fù)發(fā)明輪子 191
本章小結(jié) 191
第5章 部署模式和工具 193
技術(shù)要求 194
設(shè)計(jì)系統(tǒng) 194
基于原則構(gòu)建 196
探索一些標(biāo)準(zhǔn)的機(jī)器學(xué)習(xí)模式 199
在數(shù)據(jù)湖中暢游 199
微服務(wù) 200
基于事件的設(shè)計(jì) 202
批處理 203
容器化 204
在AWS上托管你自己的微服務(wù) 208
推送到ECR 209
在ECS上托管 211
使用Airflow構(gòu)建通用管道 224
Airflow 224
構(gòu)建高級(jí)機(jī)器學(xué)習(xí)管道 237
使用ZenML 237
使用Kubeflow 249
選擇你的部署策略 259
本章小結(jié) 260
第6章 擴(kuò)展規(guī)模 262
技術(shù)要求 263
使用Spark進(jìn)行擴(kuò)展 263
Spark技巧和竅門 265
云上的Spark 273
啟動(dòng)無服務(wù)器基礎(chǔ)設(shè)施 283
使用Kubernetes實(shí)現(xiàn)大規(guī)模容器化 292
使用Ray進(jìn)行擴(kuò)展 294
開始使用Ray進(jìn)行機(jī)器學(xué)習(xí) 298
設(shè)計(jì)大規(guī)模系統(tǒng) 305
本章小結(jié) 308
第7章 深度學(xué)習(xí)、生成人工智能和LLMOps 310
深入探討深度學(xué)習(xí) 311
使用PyTorch 314
將深度學(xué)習(xí)擴(kuò)展并投入生產(chǎn)實(shí)踐 318
微調(diào)和遷移學(xué)習(xí) 322
使用LLM 331
理解LLM 332
通過API使用LLM 333
使用LLM進(jìn)行編碼 336
利用LLM構(gòu)建未來 340
LLM驗(yàn)證 341
PromptOps 343
本章小結(jié) 344
第8章 構(gòu)建ML微服務(wù) 345
技術(shù)要求 345
理解預(yù)測(cè)問題 346
設(shè)計(jì)我們的預(yù)測(cè)服務(wù) 348
選擇工具 350
規(guī)?;?xùn)練 352
使用FastAPI提供模型服務(wù) 356
響應(yīng)和請(qǐng)求模式 359
在微服務(wù)中管理模型 363
將所有內(nèi)容整合在一起 366
容器化并部署到Kubernetes 371
將應(yīng)用程序容器化 372
使用Kubernetes進(jìn)行擴(kuò)展 373
部署策略 376
本章小結(jié) 377
第9章 構(gòu)建一個(gè)提取、轉(zhuǎn)換、機(jī)器學(xué)習(xí)用例 379
技術(shù)要求 380
理解批處理問題 382
設(shè)計(jì)ETML解決方案 384
工具選擇 386
接口和存儲(chǔ) 386
模型的擴(kuò)展 387
ETML管道的調(diào)度 388
執(zhí)行構(gòu)建 389
使用高級(jí)Airflow功能構(gòu)建ETML管道 390
本章小結(jié) 403

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)