ที่ NVIDIA GTC ทาง Hewlett Packard Enterprise (NYSE: HPE) ได้ประกาศการอัปเดตหนึ่งในพอร์ตโฟลิโอ AI-native ที่ครอบคลุมมากที่สุดในอุตสาหกรรม เพื่อพัฒนาการดำเนินงานของแอปพลิเคชัน Generative AI (GenAI), Deep Learning และMachine Learning (ML) ซึ่งการอัปเดตประกอบด้วยความพร้อมของโซลูชัน GenAI แบบ full-stack ที่ออกแบบโดย HPE และ NVIDIA ตัวอย่างซอฟต์แวร์ Machine Learning ของเครื่อง HPE สถาปัตยกรรมอ้างอิง retrieval-augmented generation (RAG) ขององค์กรและ รองรับการพัฒนาผลิตภัณฑ์ในอนาคตโดยใช้แพลตฟอร์มใหม่อย่าง NVIDIA Blackwell
นายพลาศิลป์ วิชิวานิเวศน์ กรรมการผู้จัดการ ฮิวเลตต์ แพคการ์ด เอ็นเตอร์ไพรส์ ประเทศไทย และเวียดนาม กล่าวว่า “เพื่อส่งมอบตามคำมั่นสัญญาของ GenAI และจัดการกับวงจร AI เต็มรูปแบบได้อย่างมีประสิทธิภาพ โซลูชันจะต้องผสมผสานด้วยการออกแบบ ตั้งแต่การฝึกอบรมและการปรับแต่งโมเดลในองค์กร ในสถานที่หรือคลาวด์สาธารณะ ไปจนถึงการอนุมานของ Edge ซึ่ง AI คือ workload บนคลาวด์แบบไฮบริดโดย HPE และ NVIDIA มีการสร้างสรรค์นวัตกรรมร่วมกันมาอย่างยาวนาน และเราจะยังคงนำเสนอโซลูชันซอฟต์แวร์และฮาร์ดแวร์ AI ที่ออกแบบร่วมกัน ซึ่งช่วยให้ลูกค้าของเราเร่งการพัฒนาและปรับใช้ GenAI จากแนวคิดไปสู่ผลิตภัณฑ์”
Generative AI สามารถเปลี่ยนข้อมูลจากอุปกรณ์ที่เชื่อมต่อ ศูนย์ข้อมูล และคลาวด์ให้เป็นข้อมูลเชิงลึกที่สามารถขับเคลื่อนความก้าวหน้าในอุตสาหกรรมต่าง ๆ ความร่วมมือที่เพิ่มมากขึ้นระหว่าง NVIDAI กับ HPE จะช่วยให้องค์กรต่าง ๆ สามารถส่งมอบประสิทธิภาพการทำงานที่ไม่เคยมีมาก่อนโดยใช้ประโยชน์จาก ข้อมูลเพื่อพัฒนาและปรับใช้แอปพลิเคชัน AI ใหม่เพื่อเปลี่ยนแปลงธุรกิจของพวกเขา
การฝึกอบรมและการปรับแต่ง GenAI ที่ขับเคลื่อนด้วยซูเปอร์คอมพิวเตอร์
จากการประกาศที่งาน Supercomputing 2023 (SC23) ว่าโซลูชันซูเปอร์คอมพิวเตอร์ของ HPE สำหรับ Generative AI พร้อมให้สั่งซื้อแล้วสำหรับองค์กรที่กำลังมองหาโซลูชันแบบ Full-stack ที่กำหนดค่าไว้ล่วงหน้าและมีการทดสอบแล้ว สำหรับการพัฒนาและการฝึกอบรมโมเดล AI ขนาดใหญ่ สร้างขึ้นโดยมีจุดประสงค์เพื่อช่วยลูกค้าเร่งการเกิดขึ้นของโปรเจ็กต์ GenAI และ Deep learning โซลูชันแบบครบวงจรนี้ขับเคลื่อนโดย NVIDIA และสามารถรองรับ NVIDIA GH200 Grace Hopper Superchips ได้มากถึง 168 ตัว
โซลูชันนี้ช่วยให้องค์กรขนาดใหญ่ สถาบันวิจัย และหน่วยงานภาครัฐปรับปรุงกระบวนการพัฒนาโมเดลด้วยสแต็กซอฟต์แวร์ AI/ML ที่ช่วยให้ลูกค้าเร่งการเกิดขึ้นของโปรเจ็กต์ GenAI และ Deep learning รวมถึง LLM ระบบผู้แนะนำ และฐานข้อมูลเวกเตอร์ โซลูชันแบบ Full-stack ครบวงจรนี้มาพร้อมกับบริการสำหรับการติดตั้งและตั้งค่า ได้รับการออกแบบมาเพื่อใช้ในศูนย์วิจัย AI และองค์กรขนาดใหญ่ เพื่อให้ตระหนักถึงความคุ้มค่าของเวลาที่ได้รับการปรับปรุงและเพิ่มความเร็วในการฝึกอบรม 2-3 เท่า
การปรับแต่งและการอนุมานของ GenAI ระดับองค์กร
โซลูชันการประมวลผลระดับองค์กรของ HPE สำหรับ Generative AI พร้อมให้บริการแก่ลูกค้าโดยตรงหรือผ่าน HPE GreenLake ด้วยโมเดลการจ่ายต่อการใช้งานที่ยืดหยุ่นและปรับได้ มีการร่วมกันทางวิศวกรรมกับ NVIDIA โซลูชันการปรับแต่งและการอนุมานต่าง ๆ ที่กำหนดค่าไว้ล่วงหน้าได้รับการออกแบบมาเพื่อลดเวลาและต้นทุนในการเพิ่มความเร็ว โดยนำเสนอการประมวลผล พื้นที่เก็บข้อมูล ซอฟต์แวร์ เครือข่าย และบริการให้คำปรึกษาที่เหมาะสมซึ่งองค์กรต้องการเพื่อสร้างแอปพลิเคชัน GenAI โซลูชันแบบ แบบ AI ดั้งเดิมช่วยให้ธุรกิจต่าง ๆ มีความเร็ว ขนาด และการควบคุมที่จำเป็นในการปรับแต่งโมเดลพื้นฐานโดยใช้ข้อมูลส่วนตัว และปรับใช้แอปพลิเคชัน GenAI ภายในโมเดลคลาวด์แบบไฮบริด สามารถดูตัวอย่างได้ที่ Discover Barcelona 2023
โดดเด่นด้วยคลัสเตอร์การประมวลผล AI ประสิทธิภาพสูงและซอฟต์แวร์จาก HPE และ NVIDIA โซลูชันนี้เหมาะอย่างยิ่งสำหรับการปรับแต่งโมเดล RAG และการทยอยลดการอนุมาน (scale-out inference) โดยเวลาของกระบวนการปรับแต่งสำหรับโมเดล Llama 2 มูลค่า 7 หมื่นล้านพารามิเตอร์ที่ใช้งานโซลูชันนี้จะลดลงตามจำนวนโหนด โดยใช้เวลา 6 นาทีบนระบบ 16 โหนด ซึ่งจะทำให้เกิดความเร็วและประสิทธิภาพมากขึ้นเพื่อช่วยให้ลูกค้าทราบเวลาต่อมูลค่าได้เร็วขึ้นโดยการปรับปรุงประสิทธิภาพการทำงานทางธุรกิจด้วยแอปพลิเคชัน AI เช่น ผู้ช่วยเสมือน แชทบอทอัจฉริยะ และการค้นหาระดับองค์กร
ขับเคลื่อนโดยเซิร์ฟเวอร์ HPE ProLiant DL380a Gen11 โซลูชันได้รับการกำหนดค่าล่วงหน้าด้วย NVIDIA GPU, แพลตฟอร์มเครือข่ายอีเทอร์เน็ต NVIDIA Spectrum-X และ NVIDIA BlueField-3 DPU โซลูชันดังกล่าวได้รับการปรับปรุงโดยแพลตฟอร์ม Machine Learning และซอฟต์แวร์การวิเคราะห์ของ HPE, ซอฟต์แวร์ NVIDIA AI Enterprise 5.0 พร้อมด้วยไมโครเซอร์วิส NVIDIA NIM ใหม่ เพื่อความเหมาะสมของโมเดล AI เช่นเดียวกับ NVIDIA NeMo Retriever และ Data Science อื่นๆ และไลบรารี AI
ผู้เชี่ยวชาญของ HPE Services จะช่วยองค์กรต่าง ๆ ออกแบบ ปรับใช้ และจัดการโซลูชัน ซึ่งรวมถึงการใช้เทคนิคการปรับแต่งโมเดลที่เหมาะสม เพื่อแก้ไขส่วนที่ยังขาดหายไปของ AI
จากต้นแบบสู่การทำผลิตภัณฑ์
HPE และ NVIDIA กำลังทำงานร่วมกันเกี่ยวกับโซลูชันซอฟต์แวร์ที่จะช่วยให้องค์กรต่าง ๆ ก้าวไปอีกขั้น ด้วยการเปลี่ยนการทดสอบความเป็นไปได้ของ AI และ ML ให้เป็นแอปพลิเคชันที่ใช้งานจริง พร้อมให้ลูกค้าของ HPE ได้ดูตัวอย่างเทคโนโลยีแล้ว ซอฟต์แวร์ HPE Machine Learning Inference นี้ จะช่วยให้องค์กรต่าง ๆ สามารถปรับใช้โมเดล ML ได้อย่างรวดเร็วและปลอดภัย ข้อเสนอใหม่นี้จะรวมเข้ากับ NVIDIA NIM เพื่อส่งมอบโมเดลพื้นฐานที่ปรับให้เหมาะสมโดย NVIDIA โดยใช้คอนเทนเนอร์ที่ได้รับปรับแต่งภายในมาให้แล้ว
เพื่อช่วยเหลือองค์กรที่ต้องการสร้างและปรับใช้แอปพลิเคชัน GenAI ที่มีข้อมูลส่วนตัวได้อย่างรวดเร็ว HPE ได้พัฒนาสถาปัตยกรรมอ้างอิงสำหรับ RAG ระดับองค์กร ซึ่งมีวางจำหน่ายแล้วในปัจจุบัน ซึ่งใช้สถาปัตยกรรมไมโครเซอร์วิส NVIDIA NeMo Retriever ข้อเสนอนี้ประกอบด้วยฐานข้อมูลที่ครอบคลุมจาก HPE Ezmeral Data Fabric Software และ HPE GreenLake สำหรับการจัดเก็บไฟล์สถาปัตยกรรมอ้างอิงใหม่จะนำเสนอพิมพ์เขียวแก่ธุรกิจต่างๆเพื่อสร้างแชทบอทเจนเนอเรเตอร์หรือโปรแกรมควบคุมที่กำหนดเอง
เพื่อช่วยในการจัดเตรียมข้อมูล การฝึกอบรม GenAI และการอนุมาน โซลูชันดังกล่าวได้รวมเครื่องมือและโซลูชัน Open source เต็มรูปแบบจากซอฟต์แวร์ HPE Ezmeral Unified Analytics และซอฟต์แวร์ AI ของ HPE รวมถึงซอฟต์แวร์การจัดการข้อมูล HPE Machine Learning, HPE Machine Learning Development Environment ซอฟต์แวร์ และซอฟต์แวร์ HPE Machine Learning Inference ใหม่ โดยซอฟต์แวร์ AI ของ HPE มีให้บริการทั้งบนซูเปอร์คอมพิวเตอร์ของ HPE และโซลูชันการประมวลผลระดับองค์กรสำหรับ AI ทั่วไป เพื่อให้ลูกค้ามีสภาพแวดล้อมที่สอดคล้องกันในการจัดการปริมาณงาน GenAI ของตน
โซลูชันเจเนอเรชันใหม่ที่สร้างขึ้นบนแพลตฟอร์ม NVIDIA Blackwell
HPE จะพัฒนาผลิตภัณฑ์ในอนาคตโดยใช้แพลตฟอร์ม NVIDIA Blackwell ที่เพิ่งประกาศใหม่ ซึ่งประกอบด้วย Transformer Engine รุ่นที่สองเพื่อเร่งปริมาณงาน GenAI รายละเอียดเพิ่มเติมและความพร้อมใช้งานของผลิตภัณฑ์ HPE ที่กำลังจะมีขึ้นซึ่งมี NVIDIA GB200 Grace Blackwell Superchip, HGX B200 และ HGXB100 จะมีการประกาศในอนาคต