崗位職責(zé)
1. 參與AI模型服務(wù)平臺(tái)的核心設(shè)計(jì)與開發(fā),如模型推理服務(wù)平臺(tái)核心能力搭建及各類管理功能;
2. 參與平臺(tái)管理后臺(tái)及相關(guān)配置界面開發(fā),實(shí)現(xiàn)模型部署服務(wù)監(jiān)控資源調(diào)度等功能的可視化管理,提升操作便捷性;
3. 持續(xù)跟進(jìn)AI Infra及大模型應(yīng)用相關(guān)開源項(xiàng)目,評(píng)估技術(shù)可行性,快速集成適配平臺(tái)的輕量化技術(shù)方案;
4. 基于Docker/K3s環(huán)境,編寫自動(dòng)化腳本,完成裸金屬服務(wù)器的環(huán)境檢測系統(tǒng)初始化及模型運(yùn)行環(huán)境的標(biāo)準(zhǔn)化配置。
崗位要求
1. 熟悉Python或Go編程語言,具備2年以上服務(wù)端開發(fā)經(jīng)驗(yàn),能獨(dú)立完成后端模塊開發(fā)API設(shè)計(jì)與調(diào)試,具備良好的系統(tǒng)設(shè)計(jì)與邏輯抽象能力;
2. 熟悉Docker容器化技術(shù),了解K3s/Kubernetes基礎(chǔ)使用,具備容器化環(huán)境下的開發(fā)部署與問題調(diào)試經(jīng)驗(yàn);
3. 了解大模型推理服務(wù)或AI應(yīng)用的基本原理,有相關(guān)項(xiàng)目實(shí)踐經(jīng)驗(yàn)者優(yōu)先;具備良好的工程習(xí)慣,能獨(dú)立推進(jìn)功能開發(fā),并完成相關(guān)技術(shù)文檔編寫;
4. 具備較強(qiáng)的問題排查能力,能快速定位并解決開發(fā)部署過程中的環(huán)境代碼相關(guān)問題。
加分項(xiàng)
1. 深入使用或研究過vLLMllama.cppFastChat等模型服務(wù)項(xiàng)目;具備GPU服務(wù)器運(yùn)維CUDA環(huán)境配置或AI推理/訓(xùn)練環(huán)境調(diào)優(yōu)經(jīng)驗(yàn);
2. 參與過平臺(tái)型系統(tǒng)調(diào)度系統(tǒng)或資源管理類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),有相關(guān)架構(gòu)設(shè)計(jì)或核心模塊開發(fā)經(jīng)驗(yàn);
3. 使用過RAGAgent或工作流相關(guān)框架(如DifyLangChain等),有大模型應(yīng)用開發(fā)經(jīng)驗(yàn)者優(yōu)先;
4. 具備全棧開發(fā)能力,熟悉React/Vue等前端框架及現(xiàn)代前端工程化,能獨(dú)立完成簡單前端頁面開發(fā);
5. 熟悉Linux系統(tǒng)運(yùn)維,,掌握Linux自定義鏡像封裝(適配GPU及模型運(yùn)行場景)。
舉報(bào)
1. 參與AI模型服務(wù)平臺(tái)的核心設(shè)計(jì)與開發(fā),如模型推理服務(wù)平臺(tái)核心能力搭建及各類管理功能;
2. 參與平臺(tái)管理后臺(tái)及相關(guān)配置界面開發(fā),實(shí)現(xiàn)模型部署服務(wù)監(jiān)控資源調(diào)度等功能的可視化管理,提升操作便捷性;
3. 持續(xù)跟進(jìn)AI Infra及大模型應(yīng)用相關(guān)開源項(xiàng)目,評(píng)估技術(shù)可行性,快速集成適配平臺(tái)的輕量化技術(shù)方案;
4. 基于Docker/K3s環(huán)境,編寫自動(dòng)化腳本,完成裸金屬服務(wù)器的環(huán)境檢測系統(tǒng)初始化及模型運(yùn)行環(huán)境的標(biāo)準(zhǔn)化配置。
崗位要求
1. 熟悉Python或Go編程語言,具備2年以上服務(wù)端開發(fā)經(jīng)驗(yàn),能獨(dú)立完成后端模塊開發(fā)API設(shè)計(jì)與調(diào)試,具備良好的系統(tǒng)設(shè)計(jì)與邏輯抽象能力;
2. 熟悉Docker容器化技術(shù),了解K3s/Kubernetes基礎(chǔ)使用,具備容器化環(huán)境下的開發(fā)部署與問題調(diào)試經(jīng)驗(yàn);
3. 了解大模型推理服務(wù)或AI應(yīng)用的基本原理,有相關(guān)項(xiàng)目實(shí)踐經(jīng)驗(yàn)者優(yōu)先;具備良好的工程習(xí)慣,能獨(dú)立推進(jìn)功能開發(fā),并完成相關(guān)技術(shù)文檔編寫;
4. 具備較強(qiáng)的問題排查能力,能快速定位并解決開發(fā)部署過程中的環(huán)境代碼相關(guān)問題。
加分項(xiàng)
1. 深入使用或研究過vLLMllama.cppFastChat等模型服務(wù)項(xiàng)目;具備GPU服務(wù)器運(yùn)維CUDA環(huán)境配置或AI推理/訓(xùn)練環(huán)境調(diào)優(yōu)經(jīng)驗(yàn);
2. 參與過平臺(tái)型系統(tǒng)調(diào)度系統(tǒng)或資源管理類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),有相關(guān)架構(gòu)設(shè)計(jì)或核心模塊開發(fā)經(jīng)驗(yàn);
3. 使用過RAGAgent或工作流相關(guān)框架(如DifyLangChain等),有大模型應(yīng)用開發(fā)經(jīng)驗(yàn)者優(yōu)先;
4. 具備全棧開發(fā)能力,熟悉React/Vue等前端框架及現(xiàn)代前端工程化,能獨(dú)立完成簡單前端頁面開發(fā);
5. 熟悉Linux系統(tǒng)運(yùn)維,,掌握Linux自定義鏡像封裝(適配GPU及模型運(yùn)行場景)。
舉報(bào)
溫馨提示
- 你可能感興趣的職位
- 最近瀏覽記錄
-
10-30K/月
-
6-15K/月
-
5-6K/月
-
3.3-5K/月
-
6-9K/月
-
8-10K/月
-
7-10K/月
-
10-15K/月
暫沒有相關(guān)信息
- 公司規(guī)模:100-499人
- 公司性質(zhì):0
- 所屬行業(yè):電力、電氣、自動(dòng)化、熱力、鍋爐、照明、電池、電源、電纜、光電等
- 聯(lián)系人:黃丹琪
- 手機(jī):會(huì)員登錄后才可查看
- 郵箱:會(huì)員登錄后才可查看
- 郵政編碼:
工作地址
- 地址:深圳市南山區(qū)粵海街道盈峰中心16樓
HR問答
查看更多






