
DeepSeek คือ บริษัทผู้พัฒนาด้านปัญญาประดิษฐ์จากประเทศจีน ก่อตั้งขึ้นโดยเหลียง เหวินเฟิง (Liang Wenfeng) ในเดือนพฤษภาคม 2023 บริษัทนี้เป็นที่รู้จักจากการพัฒนาโมเดลภาษาขนาดใหญ่แบบโอเพนซอร์สที่มีประสิทธิภาพสูง โดยมีสำนักงานใหญ่ตั้งอยู่ที่เมืองหางโจว มณฑลเจ้อเจียง ประเทศจีน
ในวันที่ 21 มกราคม 2025 ที่ผ่านมาทางบริษัท DeepSeek ได้เปิดตัวโมเดล DeepSeek-R1 โมเดลปัญญาประดิษฐ์ LLM แบบคิดหาเหตุผลก่อนตอบออกมา 2 ตัว ประกอบไปด้วย DeepSeek-R1-Zero และ DeepSeek-R1
สรุปข่าว
DeepSeek-R1-Zero เป็นโมเดลที่ถูกฝึกด้วยหลักการ Reinforcement Learning หรือการฝึกแบบวางเป้าหมาย และให้โมเดลพยายามทำไปจนถึงเป้าหมายให้สำเร็จ
DeepSeek-R1 เป็นโมเดลที่ถูกฝึกด้วยหลักการ Supervised Fine-Tuning หรือการฝึกด้วยชุดข้อมูลการคิดเป็นเหตุเป็นผลก่อน จากนั้นจึงค่อยมาฝึกแบบ Reinforcement Learning ผลที่ได้ คือได้โมเดลที่ใกล้เคียงกับ OpenAI o1
นอกจากโมเดลตระกูล R1 ยังมีโมเดลขนาดเล็กที่ย่อมาจาก Qwen และ Llama ซึ่งแม้จะเป็นโมเดลปัญญาประดิษฐ์ขนาดเล็กแต่มีประสิทธิภาพสูงในระดับ OpenAI o1-mini โมเดลขนาดเล็กสุดมีขนาดเพียง 1.5B เท่านั้น
การเปิดตัวโมเดลปัญญาประดิษฐ์ดังกล่าวกลายเป็นหัวข้อสนทนาในวงการปัญญาประดิษฐ์ AI ทั่วโลก ซึ่งถึงความก้าวหน้าครั้งใหญ่ เพราะโมเดลมีขนาดเล็กแค่ 1.5B เท่านั้น แต่กลับมีความสามารถหลายด้านสูงกว่า OpenAI o1-mini และใช้ต้นทุนในการฝึกที่ถูกกว่า โดยใช้เงินฝึก AI ทั้งหมดไปเพียง 5.6 ล้านดอลลาร์สหรัฐ หรือประมาณ 190 ล้านบาทเท่านั้น
ด้วยผลงานดังที่กล่าวมาในข้างต้น ทำให้ในวันนี้ DeepSeek ขึ้นเป็นอันดับ 1 แอปยอดนิยมของ App Store ในสหรัฐอเมริกา แซงหน้า ChatGPT ไปเป็นที่เรียบร้อย
ที่มาข้อมูล : https://techcrunch.com/2025/01/26/deepseek-gets-silicon-valley-talking/
ที่มารูปภาพ : DeepSeek

TNNThailand