DeepSeek คือใคร ? ทำไมแซง ChatGPT ได้

27 ม.ค. 2025

13:41 น

DeepSeek คือ บริษัทผู้พัฒนาด้านปัญญาประดิษฐ์จากประเทศจีน ก่อตั้งขึ้นโดยเหลียง เหวินเฟิง (Liang Wenfeng) ในเดือนพฤษภาคม 2023 บริษัทนี้เป็นที่รู้จักจากการพัฒนาโมเดลภาษาขนาดใหญ่แบบโอเพนซอร์สที่มีประสิทธิภาพสูง โดยมีสำนักงานใหญ่ตั้งอยู่ที่เมืองหางโจว มณฑลเจ้อเจียง ประเทศจีน

ในวันที่ 21 มกราคม 2025 ที่ผ่านมาทางบริษัท DeepSeek ได้เปิดตัวโมเดล DeepSeek-R1 โมเดลปัญญาประดิษฐ์ LLM แบบคิดหาเหตุผลก่อนตอบออกมา 2 ตัว ประกอบไปด้วย DeepSeek-R1-Zero และ DeepSeek-R1

สรุปข่าว

การที่ใช้ต้นทุนในการฝึกโมเดลที่ต่ำลง แปลว่าบริษัทขนาดเล็กจะสามารถฝึกฝนโมเดลใหม่ ๆ ได้เร็วและใช้เงินได้น้อยลง กระบวนการที่โมเดลใช้ความรู้ที่ได้จากการฝึกฝน AI ก็จะเติบโตมากขึ้นเพราะเข้าถึงทรัพยากรได้อย่างทั่วถึง ความสามารถของ DeepSeek ยังแสดงให้เห็นว่าโมเดล AI แบบโอเพนซอร์สสามารถแซงหน้าโมเดลแบบปิดได้แล้วอีกด้วย

DeepSeek-R1-Zero เป็นโมเดลที่ถูกฝึกด้วยหลักการ Reinforcement Learning หรือการฝึกแบบวางเป้าหมาย และให้โมเดลพยายามทำไปจนถึงเป้าหมายให้สำเร็จ

DeepSeek-R1 เป็นโมเดลที่ถูกฝึกด้วยหลักการ Supervised Fine-Tuning หรือการฝึกด้วยชุดข้อมูลการคิดเป็นเหตุเป็นผลก่อน จากนั้นจึงค่อยมาฝึกแบบ Reinforcement Learning ผลที่ได้ คือได้โมเดลที่ใกล้เคียงกับ OpenAI o1

นอกจากโมเดลตระกูล R1 ยังมีโมเดลขนาดเล็กที่ย่อมาจาก Qwen และ Llama ซึ่งแม้จะเป็นโมเดลปัญญาประดิษฐ์ขนาดเล็กแต่มีประสิทธิภาพสูงในระดับ OpenAI o1-mini โมเดลขนาดเล็กสุดมีขนาดเพียง 1.5B เท่านั้น

การเปิดตัวโมเดลปัญญาประดิษฐ์ดังกล่าวกลายเป็นหัวข้อสนทนาในวงการปัญญาประดิษฐ์ AI ทั่วโลก ซึ่งถึงความก้าวหน้าครั้งใหญ่ เพราะโมเดลมีขนาดเล็กแค่ 1.5B เท่านั้น แต่กลับมีความสามารถหลายด้านสูงกว่า OpenAI o1-mini และใช้ต้นทุนในการฝึกที่ถูกกว่า โดยใช้เงินฝึก AI ทั้งหมดไปเพียง 5.6 ล้านดอลลาร์สหรัฐ หรือประมาณ 190 ล้านบาทเท่านั้น

ด้วยผลงานดังที่กล่าวมาในข้างต้น ทำให้ในวันนี้ DeepSeek ขึ้นเป็นอันดับ 1 แอปยอดนิยมของ App Store ในสหรัฐอเมริกา แซงหน้า ChatGPT ไปเป็นที่เรียบร้อย

ที่มาข้อมูล : https://techcrunch.com/2025/01/26/deepseek-gets-silicon-valley-talking/

ที่มารูปภาพ : DeepSeek

TNNThailand

แท็กบทความ

DeepSeek คือใคร ? ทำไมแซง ChatGPT ได้

ข่าวที่เกี่ยวข้อง