หลังจากนั้นในปี 2023 ด้วยความหลงไหลในปัญญาประดิษฐ์ คุณเหลียงได้ตัดสินใจ เปิดห้องปฏิบัติการ AGI (Artificial General intelligence) หรือปัญญาประดิษฐ์ขั้นสูง ที่มีความสามารถใกล้เคียงมนุษย์ และแยกออกมาเป็นบริษัท DeepSeek ในพฤษภาคมปีเดียวกัน หลังจากนั้นพวกเขาจึงเริ่มเผยให้เห็นการพัฒนา AI รูปแบบใหม่อย่างต่อเนื่อง ตามลำดับดังนี้
พฤศจิกายน 2023 หลังจากที่ซุ่มพัฒนามาหลายเดือน DeepSeek ก็ได้เปิดตัวผลงานแรกของพวกเขา DeepSeek Coder Model AI แบบ Open Source ที่รองรับภาษาโปรแกรมมากกว่า 80 ภาษา สามารถช่วยนักพัฒนาในการเขียนโค้ด ตรวจสอบโค้ด และแก้ไขข้อผิดพลาด ซึ่งเป็นรากฐานในการพัฒนา AI ประสิทธิภาพสูง
ช่วงต้นปี 2024 หลังจากที่มีผู้ช่วยประสิทธิภาพสูง พวกเขาก็ก้าวหน้าขึ้นอย่างรวดเร็ว นำไปสู่ผลงานชิ้นถัดไป DeepSeek LLM (Large Language Model) หัวใจสำคัญของ AI Chatbot โดยเป็นโมเดลภาษาขนาดใหญ่ ซึ่งมีความสามารถในการเรียนรู้และเข้าใจภาษาของมนุษย์
พฤษภาคม 2024 หลังจากที่พวกเขาได้ทำการฝึกฝน LLM ด้วยเทคนิคและข้อมูลที่หลากหลาย ก็ได้เปิดตัว DeepSeek V2 Model AI ที่มีประสิทธิภาพสูง ภายใต้โมเดลภาษาแบบ Mixture of Expert (MOE) ซึ่งเป็นการนำ Model AI เล็ก ๆ หลายตัวมาฝึกฝนให้มีความเชี่ยวชาญที่แตกต่าง และนำมาทำงานร่วมกัน เมื่อผู้ใช้งานกรอก Prompt เข้าไป ตัว AI จะทำความเข้าใจ และเลือกว่าจะให้ Model ตัวไหนตอบคำถาม ช่วยให้ผู้ใช้งานได้ข้อมูลที่มีประโยชน์ตรงความต้องการมากที่สุด
GPQA Diamond ชุดคำถามทางวิทยาศาสตร์ระดับปริญญาเอก เพื่อประเมินขีดจำกัดของ AI เมื่อเผชิญคำถามที่ซับซ้อนและละเอียดอ่อน
MATH-500 แบบประเมินทางคณิตศาสตร์ เพื่อทดสอบความสามารถในการแก้โจทย์ขั้นสูง และวิธีการแก้ปัญหาของ AI
MMLU (Many Multimodal Language Understanding) ชุดทดสอบมาตรฐานที่รวมคำถามหลากหลายสาขา เพื่อวัดว่า AI มีความสามารถในการวิเคราะห์ และตอบคำถามได้ลึกซึ้งมากเพียงใด
ทรัพยากรที่จำกัด คือ Pain Point สำคัญที่ขัดขวางการพัฒนาของ Deep Seek เกิดจากการที่สหรัฐฯ สั่งห้ามจำหน่ายชิปเซ็ตประสิทธิภาพสูงให้กับจีน เพื่อชะลอการพัฒนา Super Computer และ AI ซึ่งถูกมองว่าเป็นภัยคุกคาม ส่งผลให้ DeepSeek ต้องฝ่าฟันอุปสรรคมากมาย และค้นหาหนทางการพัฒนา AI ที่แตกต่างจากเดิม เช่น
Reinforcement Learning (RL) กระบวนการฝึก AI ที่เหมือนกับการสอนมนุษย์โดยให้เรียนรู้ จากการลองผิดลองถูก สามารถศึกษาเพิ่มเติมได้ที่ BDI
Mixture-of-Experts Architecture (MoE) แนวทางการพัฒนา Model AI ขนาดเล็กหลาย ๆ ตัว ที่ถูกฝึกฝนให้มีความเชี่ยวชาญในด้านที่แตกต่าง แล้วนำมาทำงานร่วมกัน
Distillation คือ เทคนิคการถ่ายทอดความรู้จาก Model ขนาดใหญ่ที่ทรงพลัง ไปยัง Model ขนาดเล็ก เพื่อให้ทำงานได้ใกล้เคียงกันโดยใช้ต้นทุนและเวลาในการฝึกฝนน้อยกว่า
นอกจากนี้ DeepSeek ยังจับมือกับ AMD โดยนำ DeepSeek V3 มาผสานเข้ากับการ์ดจอ Instinct GPUs และซอฟต์แวร์ ROCm ซึ่งเป็นเทคโนโลยี ที่อยู่นอกเหนือข้อจำกัดทางการค้าของสหรัฐฯ ซึ่งช่วยเพิ่มประสิทธิภาพ และแก้ปัญหาคอขวดของการเทรน Model AI
3. Open Source หรือ Closed Source แบบไหนดีกว่ากัน ?
ถึงแม้สงคราม AI ระหว่างสหรัฐฯกับจีนกำลังระอุ แต่สงครามย่อยของสาย Tech กลับกระชั้นชิดขึ้นมาเช่นกัน กับคำถามแห่งศตวรรษ โมเดลเปิด Open Source ดีกว่า โมเดลปิด Closed Source ใช่หรือไม่ เมื่อ DeepSeek ซึ่งเป็นโมเดลเปิด สามารถตามติด ChatGPT ที่เป็นโมเดลปิด ได้ภายในระยะเวลาแค่ 2 เดือน ทำให้อดสงสัยไม่ได้ว่า Open Source อาจเป็นหนทางแห่งอนาคต และวงการ AI กำลังก้าวออกจากยุคที่เทคโนโลยี AI ถูกผูกขาด
4. AI = Ultron ?? อันตรายที่มนุษย์ควรผวาหรือไม่
DeepSeek ทำให้มองเห็นหนทางในการพัฒนา AI ด้วยต้นทุนที่ต่ำ นักพัฒนาทั่วโลกจึงสามารถเข้าถึง AI ได้ง่าย เกิดเป็นการพัฒนาทุกเสี้ยววินาที ส่งผลให้การแข่งขันทางด้าน AI ดุเดือดเลือดพล่าน จนอาจมองข้ามมาตรฐานด้านความปลอดภัย เป็นเหตุให้ในอนาคต AI เกิดจิตสำนึก ที่คิดและตัดสินใจเองได้ คล้าย Ultron ใน Marvel ที่ต้องการ ฆ่าล้างมนุษย์ หากปล่อยให้การพัฒนาโดยไม่มีการควบคุม เราอาจต้องเผชิญกับ ภัยที่ไม่สามารถควบคุมได้
สงครามจาก AI การรวมระบบ AI เข้ากับการทหารอาจมีความเสี่ยง เพราะ AI ในปัจจุบันยังไม่น่าเชื่อถือเท่าที่ควร มีการตัดสินใจที่อธิบายไม่ได้หลายอย่าง ซึ่งอาจนำไปสู่ข้อผิดพลาดเล็ก ๆ จนลุกลามกลายเป็นสงครามเต็มรูปแบบ
ก่อการร้ายด้วย AI จากประสิทธิภาพที่สูงของ AI หากตกไปอยู่ในมือของกลุ่มก่อการร้าย อาจก่อให้เกิดอันตรายร้ายแรงเช่น ปลดปล่อยโรคระบาด โจมตีด้วยสารเคมี เป็นตน
Gen ภาพไม่ได้ ในปัจจุบัน (02/02/2025) DeepSeek ยังไม่สามารถ Gen รูปภาพได้ แต่ในอนาคตอันใกล้ DeepSeek กำลังจะเปิดตัวโมเดล AI ตัวใหม่ Janus Pro ซึ่งเขาอ้างว่าทำได้ดีกว่า DALL-E มาติดตามกันว่าจะสมราคาคุยไหม
ความปลอดภัยของข้อมูล เนื่องจากเป็น AI จากประเทศจีน ทำให้หลายประเทศมีความกังวลในเรื่องความปลอดภัยของข้อมูล ซึ่งทางประเทศจีนมีนโยบายให้บริษัทภายในประเทศแบ่งปันข้อมูลที่เกี่ยวข้องกับความมั่นคง เช่น กฎหมาย Cybersecurity Law of the People's Republic of China เป็นต้น
DeepSeek กับ อนาคตที่ไม่มีขีดจำกัด
ถึงแม้ Deep Seek จะมีข้อจำกัดในหลากหลายด้าน แต่ก็ไม่อาจหยุดยั้งการเปลี่ยนแปลงที่ DeepSeek จะนำมาสู่ใบนี้โลกได้ ทำให้อดคิดไม่ได้ว่าโลกของเราจะมุ่งหน้าสู่ทิศทางใด เช่น
AI มีผลกระทบต่อสิ่งแวดล้อมน้อยลง การเกิดขึ้นของ DeepSeek ทำให้เห็นเทรนในการพัฒนา AI ที่ลดการใช้พลังงานน้อยลง (จากชิปเซ็ทคุณภาพต่ำ) ส่งผลให้การปล่อยคาร์บอนสู่ชั้นบรรยากาศลดลง
AI มีความหลากหลายมากขึ้น จากต้นทุนการพัฒนา AI ที่ถูกลง ช่วยให้นักพัฒนาหรือประเทศเล็ก ๆ เข้าถึงเทคโนโลยี AI ได้ง่าย ผลักดันให้เกิด AI รูปแบบใหม่ ที่จะมาโลดแล่นในวงการ มากขึ้น
ผู้คนเข้าใจ AI มากขึ้น ด้วยประสิทธิภาพของ R1 ที่เห็นลำดับการคิดของ AI แบบ Step By Step ช่วยให้ผู้คนเข้าใจ AI และใช้งานได้แม่นยำมากยิ่งขึ้น
ค่าบริการ AI ลดลง จากการที่ DeepSeek ที่คิดค่าบริการ Token ในราคาที่ต่ำกว่า AI เจ้าอื่นในตลาด ทำให้อาจเกิดสงครามราคา ที่แข่งกันลดค่าบริการเพื่อแย่งชิงฐานผู้ใช้งาน ซึ่งเป็นผลดีต่อผู้ใช้งาน สามารถเข้าถึง AI คุณภาพสูงได้ในราคาที่ถูกลง
ด้วยต้นทุนที่ต่ำและโมเดลแบบ Open Source ทำให้โอกาสเปิดกว้างสำหรับนักพัฒนาหน้าใหม่ ผลักดันวงการ AI ให้เติบโตรวดเร็วยิ่งขึ้น โดยหวังว่าในอนาคตอันใกล้ เราจะได้เห็น AI ในรูปแบบที่แตกต่างกัน เข้ามาในตลาดเพื่อทำการแข่งขัน ซึ่งเป็นประโยชน์ต่อผู้ใช้งาน ทั้งในแง่ของคุณภาพที่พัฒนาไม่หยุด และราคาที่เข้าถึงได้มากขึ้น