หลักสูตร LLM Qwen ของ Alibaba เพิ่งได้รับการจัดอันดับให้เป็นหนึ่งในผู้เข้าแข่งขันระดับสูงในเกณฑ์มาตรฐาน AI ระดับโลก โดยแข่งขันกับโมเดลจาก OpenAI และ Google

โมเดล LLM ของ Alibaba—แค่ได้ยินชื่อก็คุ้นหูแล้วใช่ไหม? 

โดยเฉพาะอย่างยิ่งหากคุณได้ชมการแข่งขัน AI เกิดขึ้น 

พวกเขาไม่ได้แค่แข่งขันเท่านั้น แต่พวกเขากำลังท้าทายฝั่งตะวันตกโดยตรง… และเจริญรุ่งเรือง—เช่นเดียวกับ 5 สตาร์ทอัพด้าน AI ของจีนที่ใหญ่โต กล้าหาญ และลึกลับ.

แล้วเรื่องที่เป็นกระแสกันอยู่ล่ะคืออะไร?

Alibaba ได้ก้าวเข้าสู่โลกของ LLM (Large Language Models) อย่างเป็นทางการแล้ว ซึ่งเป็น AI อัจฉริยะที่สามารถอ่าน เขียน และพูดได้เหมือนมนุษย์โดยคาดเดาคำถัดไปในประโยค 

ในตอนนี้ AI LLM ของ Alibaba โดยเฉพาะโมเดล Qwen กำลังได้รับความนิยม และถือเป็นสิ่งที่ควรค่าแก่การใส่ใจ 

ในความเป็นจริงมันเป็นส่วนหนึ่งของ ระบบนิเวศ AI ของจีนและอาลีบาบากำลังขับเคลื่อนนวัตกรรมอย่างไร.

ในบล็อกนี้ เราจะอธิบายทุกสิ่งให้คุณทราบแบบง่ายๆ:

  • Alibaba AI LLM คืออะไร?
  • โมเดล Qwen ของ Alibaba ทำงานจริงอย่างไร?
  • และเหตุใดมันจึงถือเป็นตัวเปลี่ยนเกมสำหรับเอเชีย (และที่อื่นๆ) อย่างมาก?

หากฟังดูน่าตื่นเต้น มาเริ่มกันเลย

Alibaba AI LLM คืออะไร?

LLM (Large Language Model) ของอาลีบาบาเรียกว่า คเวน.

ได้รับการพัฒนาโดย Alibaba Cloud และเปิดตัวเวอร์ชันแรกในปี 2023 

คิดว่า Qwen เป็นเหมือนคำตอบของ ChatGPT หรือ Gemini ของ Google แต่สร้างในเอเชียเพื่อโลก

แล้วตอนนี้ Qwen จะทำอะไรได้บ้าง?

มาก.

มันสามารถ:

  • สรุปบทความยาวๆ
  • แปลระหว่างภาษา
  • ตอบคำถามของคุณ (แม้กระทั่งคำถามแปลก ๆ )
  • เขียนอีเมล บล็อก คำอธิบายผลิตภัณฑ์—อะไรก็ได้ที่คุณนึกออก
  • สร้างภาพจากข้อความเพียงอย่างเดียว
  • ดูรูปภาพแล้วบอกคุณว่ามีอะไรเกิดขึ้นในนั้น
  • สร้างวิดีโอ
  • เข้าใจและตอบสนองต่อเสียง/เสียง

ใช่แล้ว มันไม่ใช่แค่การอ่านและการเขียนอีกต่อไป 

คือการเห็น การได้ยิน การพูด และแม้กระทั่งการสร้างภาพ


ลองนึกภาพว่าคุณกำลังยัดเยียดงานนำเสนอในเวลาตี 2 

คุณมีบทความเป็นกองที่ต้องอ่าน สไลด์สองสามแผ่นที่ต้องเขียน และไม่มีพลังงานเหลือเลย


Qwen สามารถอ่านบทความเหล่านั้น ให้ประเด็นสำคัญ แนะนำเนื้อหาสไลด์ และแม้แต่เขียนอีเมลสรุปถึงเจ้านายของคุณได้ 

หากคุณต้องการใช้ประโยชน์สูงสุดจากสิ่งนี้ นี่คือ 5 เคล็ดลับจากผู้เชี่ยวชาญในการใช้ Qwen 2.5 Max เหมือนมืออาชีพ.

ไม่เลวเลยใช่ไหม?

นั่นคือสิ่งที่ทำให้ Qwen ของ Alibaba กลายเป็นเรื่องใหญ่

Alibaba LLM Qwen เป็นโอเพ่นซอร์สหรือไม่?

ใช่แล้วครับ มันเป็นโอเพ่นซอร์ส! 

อาลีบาบาได้โอเพนซอร์ส Qwen LLM (Large Language Model) หลายเวอร์ชัน รวมถึงทั้งเวอร์ชันพื้นฐานและเวอร์ชันแชท 

นั่นหมายความว่านักพัฒนา นักวิจัย และแม้แต่บริษัทต่างๆ สามารถใช้ ปรับแต่ง และสร้างสิ่งเจ๋งๆ บนนั้นได้โดยไม่เสียค่าใช้จ่าย

นี่คือสิ่งที่คุณควรทราบ:

  • โมเดลเหล่านี้มีจำหน่ายบนแพลตฟอร์มเช่น Hugging Face และ ModelScope
  • คุณสามารถเข้าถึงทั้งรหัสและน้ำหนักของโมเดลได้ (ซึ่งถือเป็นเรื่องใหญ่ในโลก AI)
  • พวกเขาได้เปิดตัวเวอร์ชันในขนาดต่างๆ เช่น Qwen 2.5 Max, Qwen-7B, Qwen-14B และแม้แต่ Qwen-VL (ซึ่งสามารถเข้าใจทั้งข้อความและรูปภาพ)

ทำไมมันถึงสำคัญ?
เพราะเมื่อโมเดลเป็นโอเพนซอร์ส จะเป็นดังนี้:

  • เข้าถึงได้มากขึ้น
  • โปร่งใสมากขึ้น
  • ผู้คนสามารถทดลองได้ง่ายขึ้น 

นอกจากนี้ยังช่วยบริษัทขนาดเล็กหรือผู้วิจัยที่ไม่สามารถสร้างแบบจำลองขนาดใหญ่เช่นนี้ได้ 

ใช่แล้ว Qwen เป็นโอเพนซอร์ส และนั่นเป็นหนึ่งในเหตุผลที่ทำให้ได้รับความสนใจมากขนาดนี้ 

Qwen จาก Alibaba มีทั้งหมดกี่รุ่น?

ซีรีส์ Qwen ของ Alibaba ก้าวหน้ามาไกลนับตั้งแต่เปิดตัวเวอร์ชันเบต้าในเดือนเมษายน 2023 

ในช่วงไม่กี่ปีที่ผ่านมา พวกเขาได้เปิดตัวเวอร์ชันต่างๆ หลายเวอร์ชัน ซึ่งแต่ละเวอร์ชันก็มีคุณลักษณะและการปรับปรุงใหม่ๆ เข้ามาด้วย 

มาดูกันอย่างรวดเร็วว่า Qwen มีวิวัฒนาการไปทีละขั้นตอนอย่างไร 

ตารางวิวัฒนาการคเวน

ปี/เดือนเวอร์ชันมีอะไรใหม่ (คุณสมบัติหลัก)
2023 – ส.ค.คเวน-7บีเปิดตัวครั้งแรก รองรับอินพุตยาว (มากถึง 32,000 โทเค็น) เหมาะสำหรับการใช้งานทั่วไป
2023 – ก.ย.คเวน-14บีโมเดลที่ใหญ่กว่าโดยมีพารามิเตอร์ 14 พันล้านรายการ แต่สามารถจัดการโทเค็นได้เพียง 8,000 รายการเท่านั้น
2023 – พ.ย.คิวเวน-1.8B และ คิวเวน-72Bโมเดลใหม่ 2 โมเดล รองรับโทเค็น 32,000 โทเค็น เหมาะอย่างยิ่งสำหรับอุปกรณ์และระดับการคำนวณที่หลากหลาย
2024 – ก.พ.คิวเวน 1.5 ซีรีย์รวดเร็วและมีประสิทธิภาพมากกว่า Qwen1
2024 – มี.ค.คเวน1.5-ม.อ.-อ.2.7บีแนะนำการผสมผสานของผู้เชี่ยวชาญ (MoE) เพื่อประสิทธิภาพการทำงานที่ชาญฉลาดและประหยัดทรัพยากรมากขึ้น
2024 – มิ.ย.ซีรีย์ Qwen2เพิ่มการรองรับสำหรับภาษาต่างๆ เพิ่มเติมและมีความเข้าใจและการใช้เหตุผลที่ดีขึ้น
2024 – ก.ย.ซีรีย์ Qwen2.5มีให้เลือกในเวอร์ชัน 3B, 14B และ 32B — พลังที่สมดุลกับความต้องการการประมวลผลที่ลดลง
2025 – เม.ย.ซีรีย์ Qwen3ก้าวกระโดดครั้งใหญ่: โมเดลหนาแน่นและ MoE จาก 0.6B ถึง 235B รองรับ 119 ภาษา
เปิดตัวระบบ 'โหมดคิด' 'โหมดไม่คิด' และระบบ 'งบคิด' อัจฉริยะ

โดยสรุปแล้วโมเดล Qwen ของ Alibaba ได้พัฒนาจากงานทั่วไปไปเป็นการใช้เหตุผลที่ซับซ้อน ในขณะที่รองรับภาษาต่างๆ มากมาย

หลักสูตร LLM ของ Alibaba เปรียบเทียบกับหลักสูตร LLM อื่น ๆ ได้อย่างไร?

เมื่อคุณออกไปค้นหาเครื่องมือ AI คุณคงจะต้องถามว่า เครื่องมือนี้เทียบกับเครื่องมืออื่นๆ ได้อย่างไร 

และมีชื่อดังๆ มากมาย เช่น:

  • แชทGPT
  • คล็อด
  • ราศีเมถุน

และตอนนี้เมื่อ Qwen แห่ง Alibaba เข้ามาร่วมฉาก มันเป็นเรื่องง่ายที่จะรู้สึกท่วมท้น

มาแยกเรื่องนี้ออกเป็นข้อง่ายๆ กันดีกว่า 

ไม่มีสาระอะไร เพียงสิ่งที่คุณต้องการรู้จริงๆ

  1. อาลีบาบา ควิน:

Qwen คือ LLM ของ Alibaba และมีพลังมากทีเดียว 

เป็นแบบหลายโหมด ซึ่งหมายความว่ามันสามารถเข้าใจและสร้างข้อความ รูปภาพ เสียง และแม้แต่วิดีโอได้ 

→ คุณสามารถโยนภาพไปที่มัน และมันจะบอกคุณว่ามีอะไรอยู่ในนั้น 

→ คุณสามารถพูดกับมันได้ และมันเข้าใจคุณ 

→ โมเดล LLM ของ Alibaba ก็ยังตอบคำถามโดยอิงจากภาพด้วย คล้ายๆ กับอธิบายมีมให้เพื่อนที่ไม่เข้าใจฟัง

มีหน้าต่างบริบทขนาดใหญ่ ซึ่งหมายความว่ามันสามารถจดจำการสนทนาหรือเอกสารที่คุณกำลังใช้งานได้มากขึ้น (มากถึง 128,000 โทเค็น—มหาศาลมาก!) 

นอกจากนี้ เวอร์ชัน Qwen 2.5 Coder ยังยอดเยี่ยมในการเขียนและดีบักโค้ดอีกด้วย 

รองรับมากกว่า 30 ภาษา และทำงานได้ดีแม้บน GPU ทั่วไป (ไม่จำเป็นต้องลงทุนมหาศาลเพื่อซื้อฮาร์ดแวร์หนักๆ)

แต่จะเทียบกับยักษ์ใหญ่เหล่านี้ได้จริงหรือ? 

นี่เป็นการเผชิญหน้าโดยตรง: Qwen 2.5 Max เทียบกับ GPT-4o และ DeepSeek: อันไหนจะชนะ?

แม้ว่า Qwen จะทรงพลัง แต่ก็ใช่ว่าจะไม่มีจุดอ่อน โดยเฉพาะอย่างยิ่งเมื่อคุณนำไปเทียบกับยักษ์ใหญ่ระดับโลกอย่าง GPT หรือ Claude 

นี่คือจุดที่มันขาดไป:

  • ไม่โอเพนซอร์สอย่างสมบูรณ์ (เวอร์ชันขั้นสูงถูกล็อกไว้โดย Alibaba Cloud)
  • การกรองเนื้อหาในตัวเนื่องจากกฎระเบียบของจีน
  • เอกสารประกอบมีจำกัดและไม่เหมาะกับผู้เริ่มต้น
  • อ่อนแอเล็กน้อยในการสนทนาแบบสบาย ๆ หรือทั่วไป
  • การเข้าถึงและบูรณาการนอกเอเชียทำได้ยากขึ้น

ใช่แล้ว Qwen เป็นสัตว์ร้ายในหลายๆ ด้าน แต่ถ้าคุณต้องการอิสรภาพ ความโปร่งใส และความยืดหยุ่นระดับโลกอย่างเต็มที่ เขาอาจไม่ตอบโจทย์ของคุณทั้งหมด

เรามาตั้งชื่อเล่นให้มันกันดีกว่าไหม?

มันเป็น Multitaskter ของเรา

  1. แชทGPT: 

หากคุณต้องการรายละเอียดเพิ่มเติม โปรดดูข้อมูลเจาะลึกของเรา หลักสูตร LLM ของ Alibaba เปรียบเทียบกับ OpenAI ได้อย่างไร และตะวันออกกำลังตามทันอย่างไร.

พูดตรงๆ ว่า ChatGPT เป็นสิ่งที่ทุกคนรู้จัก 

มันเหมือนกับ Google ในรูปแบบ AI 

คนส่วนใหญ่ใช้มันเพราะมันใช้งานได้ดีและรู้สึกง่าย 

และเมื่อเวลาผ่านไป การจัดการข้อความก็ไม่ใช่แค่เพียงการประมวลผลรูปภาพอีกต่อไป 

ด้วย GPT-4o และ o3 mini ตอนนี้สามารถสร้างรูปภาพได้ด้วย

มันเหมาะสำหรับ: 

  • การใช้งานแบบสบายๆ
  • การเขียน
  • การเข้ารหัส
  • การสรุปสิ่งต่างๆ
  • แค่คุยกันเฉยๆ 

แต่เหมือนกับเพื่อนฉลาดที่บางครั้งก็สร้างเรื่องขึ้นมาอย่างมั่นใจ ChatGPT สามารถ "เกิดภาพหลอน" คำตอบได้ พูดสิ่งที่ฟังดูถูกต้องแต่ไม่เป็นความจริง 

นอกจากนี้ยังมีการตัดความรู้ ดังนั้นจึงอาจไม่ทราบว่ามีอะไรเกิดขึ้นเมื่อวานหรือวันนี้

ถ้าจะตั้งฉายาให้ก็จะเรียกว่า “เด็กป๊อป”

  1. คล็อด :

Claude โดย Anthropic เป็นเหมือนกวีในกลุ่ม 

สร้างขึ้นมาเพื่อให้รองรับบริบทได้เป็นอย่างดี ดังนั้นหากคุณกำลังสนทนาอย่างลึกซึ้งและครุ่นคิด หรือต้องการความช่วยเหลือด้านการเขียนเชิงสร้างสรรค์ Claude คือคนที่คุณต้องการ

มันมีคุณสมบัติเจ๋งๆ เช่น:

  • สิ่งประดิษฐ์: 

คุณสามารถดูและแก้ไขสิ่งที่กำลังดำเนินการอยู่ได้แบบสดๆ 

มีประโยชน์มากเมื่อคุณกำลังระดมความคิดหรือสร้างเนื้อหา

  • โครงการ: 

จัดระเบียบงานของคุณภายใน Claude เอง เหมาะสำหรับงานที่กำลังดำเนินอยู่

  • การเขียนเชิงสร้างสรรค์: 

คล็อดรู้วิธีการเขียนด้วยอารมณ์และความสามารถ 

มันไม่ได้ให้แค่คำตอบแบบธรรมดาๆ เท่านั้น แต่ยังเขียนเหมือนว่ามันหมายถึงอย่างนั้นจริงๆ

  • การเข้ารหัส: 

ที่นี่ก็แข็งแกร่งอย่างน่าประหลาดใจเช่นกัน 

Claude 3 ได้ก้าวไปอีกขั้นในการช่วยให้มีโค้ดที่สะอาดและอ่านง่าย

แต่ยังคงเป็นแบบข้อความเท่านั้น ไม่มีการสร้างภาพ ไม่มีการรองรับเสียง ไม่มีปลั๊กอินหรือการรวมที่ซับซ้อน 

แม้ว่าจะเขียนได้สวยงามและ “ให้ความรู้สึกเหมือนมนุษย์” แต่ก็ไม่ใช่ตัวเลือกสำหรับงานมัลติมีเดีย

และเพราะฉะนั้นเราจึงตั้งชื่อมันว่า Sensitive writer คุณคิดว่าไงบ้าง?

  1. กูเกิล เจมินี่:

Gemini ของ Google พยายามทำทุกอย่าง และพูดตรงๆ ว่าไม่เลวเลย 

สามารถจัดการข้อความ รูปภาพ และเสียง และเชื่อมต่อกับระบบ Google ทั้งหมด 

ดังนั้นหากคุณเป็นผู้ใช้ Google Docs, Gmail ฯลฯ อยู่แล้ว Gemini ก็เหมาะกับคุณเลย

นอกจากนี้ยังขึ้นชื่อในเรื่องการตอบสนองที่สร้างสรรค์รวดเร็วเป็นพิเศษ 

แต่มันก็ไม่สมบูรณ์แบบ 

มันไม่สามารถจัดการการอัปโหลดไฟล์ได้ดีนัก แต่มันอาจจะดีกว่าในการเขียนโค้ด และบางครั้งก็อาจแสดงข้อมูลที่ไม่ถูกต้องออกมา โดยเฉพาะอย่างยิ่งเกี่ยวกับบุคคลหรือเหตุการณ์ในโลกแห่งความเป็นจริง 

ดังนั้นควรตรวจสอบข้อเท็จจริงให้ดีอีกครั้ง

มาต่อกันที่ Overachiever สำหรับราศีเมถุนกันดีกว่าครับ ว่าไงบ้าง?

หากคุณอยากรู้เกี่ยวกับการประลองขั้นสุดยอดระหว่างโมเดลเหล่านี้ อย่าพลาดการวิเคราะห์ของเรา โมเดล AI ใดที่ครองตลาด—ChatGPT 4 Turbo เทียบกับ Gemini 2.0 เทียบกับ Claude 3.5 เทียบกับ Qwen2.5

สรุปสั้นๆ: ใครเก่งด้านใด?

  • เกวน: 

ดีที่สุดหากคุณต้องการความสามารถมัลติโหมดแบบครบวงจร (ข้อความ รูปภาพ เสียง วิดีโอ) + การรองรับการเขียนโค้ดที่ยอดเยี่ยม + การเข้าถึงโอเพนซอร์ส (ส่วนใหญ่)

  • แชทGPT:

อุปกรณ์รอบด้าน ใช้งานง่าย พัฒนาอย่างต่อเนื่อง และคุ้นเคย แต่บางครั้งก็สร้างสิ่งใหม่ๆ ขึ้นมา

  • คล็อด : 

เหมาะสำหรับการเขียนเชิงอารมณ์ เชิงลึก หรือเชิงสร้างสรรค์ ฉลาดสุดๆ แต่จำกัดเฉพาะข้อความเท่านั้น

  • ราศีเมถุน :

เหมาะสำหรับผู้คนในระบบนิเวศของ Google เป็นแบบหลายโหมด มีความคิดสร้างสรรค์ แต่จำเป็นต้องมีการตรวจสอบข้อเท็จจริงและมีพื้นที่ให้เติบโต

หวังว่าคงทำให้ทุกอย่างกระจ่างขึ้น! 

หากคุณต้องตัดสินใจว่าจะใช้ตัวใด ทุกอย่างจะขึ้นอยู่กับกรณีการใช้งานของคุณ 

อยากสร้างสิ่งต่างๆ วิเคราะห์ภาพ หรือแปลเป็นภาษาต่างๆ ไหม? Qwen ถือว่าถูกประเมินค่าต่ำเกินไปอย่างมาก 

ต้องการผู้ช่วยที่ใช้งานทั่วไปได้อย่างราบรื่นใช่หรือไม่ ChatGPT เป็นตัวเลือกที่ยอดเยี่ยม

เหตุใดการที่ Alibaba เข้ามาในพื้นที่ LLM จึงเป็นเรื่องใหญ่ (โดยเฉพาะในเอเชีย)

แล้วทำไมการที่ Alibaba ก้าวเข้าสู่เกมโมเดลภาษาขนาดใหญ่จึงมีความสำคัญ? 

มันยิ่งใหญ่มาก ไม่ใช่แค่สำหรับเอเชีย แต่ทั่วโลก

ก่อนอื่นมาพูดถึงภาพรวมกันก่อน นั่นก็คือความสัมพันธ์ระหว่างสหรัฐฯ และจีน

มันเป็นเหมือนกับมิตรภาพที่ซับซ้อน — พวกเขาพึ่งพากันและกันแต่ก็ยังแข่งขันกันอย่างหนักอีกด้วย 

มันเป็นการผสมผสานระหว่างความร่วมมือและการแข่งขันที่เปลี่ยนแปลงเสมอ 

ดังนั้น เมื่อจีนดำเนินการครั้งใหญ่ในด้าน AI สหรัฐฯ จะต้องให้ความสนใจอย่างแน่นอน และบางครั้งก็ระมัดระวังเล็กน้อย

นี่คือเหตุผลว่าทำไมเอเชีย โดยเฉพาะจีน จึงสร้างกระแสครั้งใหญ่ในด้าน AI:

  • การลงทุนมหาศาล: 

เรากำลังพูดถึงเงินหลายพันล้านดอลลาร์ที่ทุ่มไปกับการวิจัย AI และการสร้างเทคโนโลยีรุ่นถัดไป

  • แหล่งรวมผู้มีความสามารถมากมาย: 

เอเชียมีวิศวกร นักวิทยาศาสตร์ และนักวิจัย AI ที่มีทักษะจำนวนมากทำงานในมหาวิทยาลัยและห้องปฏิบัติการชั้นนำ ซึ่งขยายขอบเขตความสามารถของ AI ออกไป

  • การสนับสนุนที่แข็งแกร่งจากรัฐบาล: 

ในประเทศจีน รัฐบาลไม่ได้แค่เฝ้าดูจากข้างสนาม 

พวกเขาคือ:

 → การระดมทุนโครงการ

 → การกำหนดนโยบายเพื่อส่งเสริม AI

 → ให้การเข้าถึงชุดข้อมูลขนาดใหญ่ได้ง่ายขึ้นซึ่งถือเป็นประโยชน์ต่อการฝึกอบรมโมเดล AI

  • ผลักดันการพึ่งพาตนเอง: 

ประเทศในเอเชียต้องการพึ่งพายักษ์ใหญ่ด้านเทคโนโลยีตะวันตกน้อยลง 

พวกเขาจึงสร้างชิป ซอฟต์แวร์ และโมเดล AI ของตัวเองเพื่อควบคุมอนาคตด้านเทคโนโลยีของพวกเขา

นี่ไม่ใช่แค่เรื่องของความทะเยอทะยานเพียงอย่างเดียว 

การเปลี่ยนแปลงครั้งนี้ทำให้ธุรกิจและนักพัฒนาเช่นคุณสามารถเข้าถึงโมเดล AI อันทรงพลังในราคาที่ดีกว่าได้ 

นอกจากนี้ยังอาจช่วยปรับปรุงความสัมพันธ์ทางการเมืองและเศรษฐกิจทั่วโลกได้เนื่องจากมีประเทศต่างๆ เข้ามามีส่วนร่วมในการพัฒนา AI มากขึ้น

ประเด็นสำคัญ: การที่ Alibaba ก้าวเข้ามาในพื้นที่ LLM เป็นส่วนหนึ่งของเรื่องราวที่ยิ่งใหญ่กว่า ซึ่งกำลังกำหนดรูปแบบการพัฒนาของ AI ทั่วโลก โดยมีเอเชียมีบทบาทสำคัญ

กรณีการใช้งานที่ฆ่าของ Alibaba LLM 

หลักสูตร LLM ของ Alibaba กำลังสร้างกระแสในธุรกิจจริงแล้ว 

นี่คือจุดที่มันโดดเด่น:

  • ระบบอัตโนมัติทางธุรกิจ: 

ลองนึกถึงงานที่ปกติต้องใช้เวลาหลายชั่วโมง — AI ของ Alibaba สามารถจัดการได้เร็วและแม่นยำยิ่งขึ้น

  • แอปพลิเคชั่นอีคอมเมิร์ซ: 

เนื่องจากเป็น Alibaba หลักสูตร LLM ของพวกเขาจึงเหมาะอย่างยิ่งในการช่วยเหลือร้านค้าออนไลน์ เช่น การแนะนำสินค้า การจัดการสินค้าคงคลัง หรือการปรับแต่งประสบการณ์การช้อปปิ้ง

  • การสนับสนุนลูกค้าและการสร้างเนื้อหา: 

Chatbots ที่เข้าใจคุณจริงๆ การสร้างเนื้อหาอย่างรวดเร็วสำหรับโฆษณาหรือโซเชียลมีเดีย และการตอบคำถามของลูกค้าอย่างราบรื่น

อาลีบาบาไม่ได้ชะลอตัวลง และพูดตรงๆ ว่าพวกเขาไม่ควรจะทำเช่นนั้น

นับตั้งแต่ ChatGPT เปิดตัว มีผู้เล่นรายใหญ่รายอื่นๆ จำนวนมากเข้ามาแข่งขันในสาขา LLM:

  • คล็อดแห่งแอนโธรปิก
  • ดีพซีคของจีน
  • เจมินี่ของกูเกิล
  • ควินน์แห่งอาลีบาบาเอง

ทุกๆ 3 ถึง 6 เดือน จะมีคนปล่อยโมเดลใหม่ที่ดีกว่าออกมา 

เมื่อเร็วๆ นี้ Alibaba ได้เปิดตัว Qwen 3 และตามที่คาดไว้ ชาวอินเทอร์เน็ตก็เริ่มพูดถึงเรื่องนี้กันอย่างคึกคัก

อินเทอร์เน็ตมีอะไรจะบอกเกี่ยวกับ Qwen LLM Models บ้าง?

Qwen กำลังสร้างกระแสอย่างเงียบ ๆ และผู้คนบนโลกออนไลน์ต่างพูดถึงเรื่องนี้มากมาย 

จากการทำผลงานเหนือกว่าคลาสขนาดเดียวกันไปจนถึงการเป็นโมเดลที่ทุกคนนึกถึงเมื่อต้องทำงานจริง นี่คือภาพรวมของสิ่งที่ผู้ใช้แบ่งปัน:

เป็นโมเดลเล็ก ๆ ที่คิดใหญ่:

ผู้ใช้จำนวนมากประหลาดใจกับประสิทธิภาพการทำงานของ Qwen โดยเฉพาะเมื่อเทียบกับขนาดของมัน

มีการกล่าวกันว่าโมเดล 32B มีประสิทธิภาพเท่ากับโมเดล 70B ซึ่งถือว่าค่อนข้างสูงเมื่อลองคิดดู 

มันทำให้ผู้คนสงสัยว่า:

“หาก 32B สามารถทำได้มากขนาดนี้ เราจำเป็นต้องใช้โมเดล 123B ขนาดใหญ่ๆ อีกต่อไปหรือไม่”

มันเร็ว ฟรี และเพียงแค่… ทำงาน: 

ผู้ที่ใช้ LLM หลายตัว เช่น ChatGPT, Claude, DeepSeek กล่าวว่าพวกเขากลับมาใช้ Qwen อยู่เรื่อย

ทำไม

เพราะมันช่วยให้ทำงานเสร็จได้โดยมีการไปมาน้อยลง แก้ไขน้อยลง และได้ผลลัพธ์ที่ชัดเจน

การเขียนโค้ดก็ค่อนข้างดีเหมือนกัน

นักพัฒนาคนหนึ่งใช้ Qwen 2.5 เพื่อสร้างแอป React และ Node.js ทั้งหมด

เขายังเปรียบเทียบกับเวอร์ชันโค้ดเดอร์ (Qwen Coder) และบอกว่า Qwen 2.5 ทำได้ดีกว่ามาก

ดังนั้น หากคุณสนใจเรื่องการพัฒนา Qwen อาจทำให้คุณประหลาดใจได้

มันยังคงมีข้อบกพร่องบางประการ

ไม่ใช่ทุกอย่างจะสมบูรณ์แบบ

ผู้คนจำนวนหนึ่งที่ทดสอบรุ่น Qwen 32B ในพื้นที่กล่าวว่าบางครั้งเครื่องจะแปลข้อความต่างๆ เป็นภาษาจีนแบบสุ่มแทนภาษาที่ร้องขอ

มันเป็นจุดบกพร่องที่เกิดขึ้นได้ยาก แต่ก็ควรค่าแก่การสังเกต ดูเหมือนว่ามันจะมีปัญหาเล็กน้อยในการปฏิบัติตามคำแนะนำในบางกรณี

มันสร้างขึ้นจากข้อมูลจำนวนมหาศาล

ความสำเร็จของ Qwen ส่วนใหญ่น่าจะมาจากชุดข้อมูลขนาดใหญ่ที่ใช้ฝึกฝน ซึ่งอาจมีจำนวนถึง 18 ล้านล้านโทเค็น

บางคนยังบอกด้วยว่าใช้ข้อมูลสังเคราะห์ (เช่น คำตอบที่คล้ายกับ Claude) และมีการจัดการโครงสร้างและคุณภาพอย่างดีเยี่ยม

ผู้คนต่างตื่นเต้นกับสิ่งที่จะเกิดขึ้นต่อไป

ผู้ใช้ต่างตั้งตารอ Qwen 3 Max และคาดเดากันว่าคู่แข่งอย่าง DeepSeek จะเปิดตัวอะไรต่อไป

มีการตื่นเต้นอย่างแท้จริงเกี่ยวกับความก้าวหน้าของ Qwen และทิศทางที่กำลังจะมุ่งหน้าไป

ข้อคิดจากเรื่องราวนี้?

Qwen ไม่ใช่แค่ LLM ธรรมดาๆ แต่เป็นเครื่องพิสูจน์ว่านางแบบตัวเล็กที่ได้รับการฝึกฝนมาอย่างดีสามารถมีน้ำหนักมากกว่าปกติได้ 

รวดเร็ว เชื่อถือได้ เปิดกว้าง (ในหลายๆ กรณี) และมักทำผลงานได้ดีกว่าชื่อดัง โดยเฉพาะสำหรับงานทั่วไปและระดับมืออาชีพ

หากคุณกำลังมองหาโมเดลที่แข็งแกร่ง ใช้งานง่าย และใช้งานได้อย่างเหมาะสม Qwen ก็คุ้มค่าที่จะลองอย่างแน่นอน

บทสรุป

หากคุณสนใจ AI สักนิด คุณก็คงรู้ว่า Alibaba สามารถก้าวไปใหญ่ได้ขนาดไหน 

และตอนนี้ Alibaba AI LLM มาถึงแล้ว พวกเขาก็ชัดเจนไม่ยั้งมือเลย

สำหรับธุรกิจ นักพัฒนา หรือแม้แต่ผู้ที่ชื่นชอบเทคโนโลยีที่สนใจ ควรจับตาดูโมเดล Alibaba LLM อย่างใกล้ชิด 

ทำไม

  • คุณจะได้รับประสิทธิภาพอันทรงพลังด้วยต้นทุนที่ลดลงมาก
  • โมเดลเหล่านี้เป็นแบบมัลติโหมด จัดการข้อความ รูปภาพ เสียง และแม้แต่วิดีโอ
  • เปิดทางสู่ตลาดเทคโนโลยีที่กำลังเติบโตอย่างรวดเร็วของเอเชีย ซึ่งมักถูกมองข้าม

โดยเฉพาะอย่างยิ่งกับ Alibaba LLM Qwen พวกเขากำลังสร้างตัวเองให้เป็นคู่แข่งที่จริงจัง

และลองมองความเป็นจริงสิว่า การแข่งขันในด้าน AI นั้นยิ่งรุนแรงมากขึ้นเรื่อยๆ 

ทุกคนจะปล่อยเวอร์ชันที่ดีขึ้นออกมาทุกๆ สองสามเดือน 

แต่คนที่สามารถเป็นผู้นำได้อย่างแท้จริงล่ะ? 

พวกเขาจะเป็นคนที่สร้างสรรค์อย่างชาญฉลาดและรับฟังสิ่งที่ผู้คนต้องการจริงๆ

แล้ว Alibaba LLM จะเข้ามาเป็นผู้นำหรือไม่? อาจจะใช่ 

แต่สิ่งหนึ่งที่แน่ใจได้ก็คือ พวกเขาอยู่ในเกมอย่างแน่นอน และตัดสินใจอย่างกล้าหาญ!

ต้องการที่จะก้าวไปข้างหน้า 3 ก้าวในวงการ AI ที่กำลังเติบโตของเอเชียหรือไม่

สมัครสมาชิก จดหมายข่าว AI Business Asia — โดยที่เราแบ่งการเปลี่ยนแปลง AI ที่ซับซ้อนออกเป็นส่วนๆ ให้กลายเป็นข้อมูลเชิงลึกที่ชัดเจนและดำเนินการได้

ไม่เป็นขุย ไม่มีเสียง 

เพียงแค่สิ่งจริงที่ช่วยให้คุณสร้างได้อย่างชาญฉลาดและรวดเร็วยิ่งขึ้น

อย่าเพียงแค่ทำตาม 

นำการแข่งขัน 

เข้าร่วมกับเราสิ ฟรี

โพสโดย อเล็กซิส ลี
โพสก่อนหน้า
คุณอาจชอบเช่นกัน

ฝากความคิดเห็นของคุณ:

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *