崗位職責
1. 參與AI模型服務平臺的核心設計與開發,如模型推理服務平臺核心能力搭建及各類管理功能;
2. 參與平臺管理后臺及相關配置界面開發,實現模型部署服務監控資源調度等功能的可視化管理,提升操作便捷性;
3. 持續跟進AI Infra及大模型應用相關開源項目,評估技術可行性,快速集成適配平臺的輕量化技術方案;
4. 基于Docker/K3s環境,編寫自動化腳本,完成裸金屬服務器的環境檢測系統初始化及模型運行環境的標準化配置。
崗位要求
1. 熟悉Python或Go編程語言,具備2年以上服務端開發經驗,能獨立完成后端模塊開發API設計與調試,具備良好的系統設計與邏輯抽象能力;
2. 熟悉Docker容器化技術,了解K3s/Kubernetes基礎使用,具備容器化環境下的開發部署與問題調試經驗;
3. 了解大模型推理服務或AI應用的基本原理,有相關項目實踐經驗者優先;具備良好的工程習慣,能獨立推進功能開發,并完成相關技術文檔編寫;
4. 具備較強的問題排查能力,能快速定位并解決開發部署過程中的環境代碼相關問題。
加分項
1. 深入使用或研究過vLLMllama.cppFastChat等模型服務項目;具備GPU服務器運維CUDA環境配置或AI推理/訓練環境調優經驗;
2. 參與過平臺型系統調度系統或資源管理類系統的設計與實現,有相關架構設計或核心模塊開發經驗;
3. 使用過RAGAgent或工作流相關框架(如DifyLangChain等),有大模型應用開發經驗者優先;
4. 具備全棧開發能力,熟悉React/Vue等前端框架及現代前端工程化,能獨立完成簡單前端頁面開發;
5. 熟悉Linux系統運維,,掌握Linux自定義鏡像封裝(適配GPU及模型運行場景)。
舉報
1. 參與AI模型服務平臺的核心設計與開發,如模型推理服務平臺核心能力搭建及各類管理功能;
2. 參與平臺管理后臺及相關配置界面開發,實現模型部署服務監控資源調度等功能的可視化管理,提升操作便捷性;
3. 持續跟進AI Infra及大模型應用相關開源項目,評估技術可行性,快速集成適配平臺的輕量化技術方案;
4. 基于Docker/K3s環境,編寫自動化腳本,完成裸金屬服務器的環境檢測系統初始化及模型運行環境的標準化配置。
崗位要求
1. 熟悉Python或Go編程語言,具備2年以上服務端開發經驗,能獨立完成后端模塊開發API設計與調試,具備良好的系統設計與邏輯抽象能力;
2. 熟悉Docker容器化技術,了解K3s/Kubernetes基礎使用,具備容器化環境下的開發部署與問題調試經驗;
3. 了解大模型推理服務或AI應用的基本原理,有相關項目實踐經驗者優先;具備良好的工程習慣,能獨立推進功能開發,并完成相關技術文檔編寫;
4. 具備較強的問題排查能力,能快速定位并解決開發部署過程中的環境代碼相關問題。
加分項
1. 深入使用或研究過vLLMllama.cppFastChat等模型服務項目;具備GPU服務器運維CUDA環境配置或AI推理/訓練環境調優經驗;
2. 參與過平臺型系統調度系統或資源管理類系統的設計與實現,有相關架構設計或核心模塊開發經驗;
3. 使用過RAGAgent或工作流相關框架(如DifyLangChain等),有大模型應用開發經驗者優先;
4. 具備全棧開發能力,熟悉React/Vue等前端框架及現代前端工程化,能獨立完成簡單前端頁面開發;
5. 熟悉Linux系統運維,,掌握Linux自定義鏡像封裝(適配GPU及模型運行場景)。
舉報
溫馨提示
- 你可能感興趣的職位
- 最近瀏覽記錄
-
6-10K/月
-
5-8K/月
-
6-10K/月
-
面議
-
8-10K/月
-
8-10K/月
-
面議
-
5-12K/月
暫沒有相關信息
- 公司規模:100-499人
- 公司性質:0
- 所屬行業:電力、電氣、自動化、熱力、鍋爐、照明、電池、電源、電纜、光電等
- 聯系人:黃丹琪
- 手機:會員登錄后才可查看
- 郵箱:會員登錄后才可查看
- 郵政編碼:
工作地址
- 地址:深圳市南山區粵海街道盈峰中心16樓






