Large Language Model

Tags:
Node Thumbnail

ทีมวิจัย Qwen ของ Alibaba Cloud เปิดตัวโมเดล LLM ในชื่อ Qwen2 มี 5 ขนาดให้เลือกตั้งแต่ 0.5B, 1.5B, 7B, 14B, และ 72B โดยชูจุดเด่นรองรับภาษาอื่นๆ นอกจากภาษาอังกฤษ เช่นแถบเอเชียตะวันออกเฉียงใต้นั้นรองรับทั้ง ไทย, เวียดนาม, อินโดนีเซีย, เมียนมาร์, ลาว, กัมพูชา และยังรองรับ context window ถึง 128K

ผลทดสอบยอดนิยมเช่น MMLU หรือ HumanEval นั้น Qwen2-72B ทำได้เหนือกว่า Llama3-70B ไปเล็กน้อย ขณะที่ Qwen2-7B ก็เอาชนะ Llama3-7B ได้หลายชุดทดสอบโดยเฉพาะชุดทดสอบ HumanEval ที่คะแนนนำค่อนข้างมาก

Qwen2 ปล่อยให้ใช้งานแบบ Apache 2.0 ยกเว้นเฉพาะ Qwen2-72B เท่านั้นที่ยังจำกัดการใช้งานแบบ Qianwen License ทำให้โมเดลขนาด 7B สามารถใช้งานได้แทบไม่มีข้อจำกัด

Tags:
Topics: 
Node Thumbnail

กูเกิล ขยายบริการ NotebookLM แอปจดโน้ตพลัง Gemini 1.5 Pro ที่ช่วยผู้ใช้เขียนรายงานได้อย่างรวดเร็ว หลังจากเปิดตัวเฉพาะในสหรัฐฯ ช่วงปลายปี 2023 โดยตอนนี้ใช้ Gemini 1.5 Pro ทำให้รองรับการอ่านรูปภาพ สามารถอ้างอิงข้อมูลในภาพของเอกสารที่ใส่เข้าไปได้

แนวทางการใช้งานสร้างเอกสาร เช่น การสร้างคำถามที่พบบ่อย, เอกสารสรุปย่อการประชุม, หรือบทเรียน โดยหลักๆ แล้ว NotebookLM เป็นการพูดคุยกับ Gemini โดยอาศัยเอกสารที่ผู้ใช้มอบให้เป็นหลัก ทำให้แน่ใจได้ว่าการพูดคุยนั้นอยู่ในประเด็นที่ต้องการ

Tags:
Topics: 
Node Thumbnail

ในงาน AWS Summit ที่กรุงเทพสัปดาห์ที่ผ่านมา aCommerce ผู้ให้บริการอีคอมเมิร์ชกับแบรนด์ต่างๆ เปิดตัวบริการในชุดโปรแกรม Market Insight ที่เปิดให้ลูกค้าสามารถสำรวจข้อมูลเชิงลึกทางธุรกิจได้ตามมุมมองที่ตนเองต้องการ

Market Insight เป็นการรวบรวมข้อมูลอีคอมเมิร์ชจากแหล่งต่างๆ รวมกว่าแสนล้านชุดข้อมูล เปิดทางให้ธุรกิจสามารถวิเคราะห์การแข่งขัน เช่น ราคาคู่แข่ง, เทรนด์สินค้าใหม่ๆ, หรือกระทั่งมอนิเตอร์ว่าสินค้าของแบรนด์ตนเองว่ามีการขายในราคาที่ผิดปกติหรือไม่ โดยบริการนี้มีมาก่อนหน้านี้แล้ว แต่ในงานครั้งนี้ทาง aCommerce เปิดฟีเจอร์ AskIQ ที่เปิดให้ผู้ใช้ถามข้อมูลได้โดยตรง โดยระบบสามารถออกรายงานจากข้อมูลที่มีทันที

Tags:
Node Thumbnail

คุณโจเซฟีน เตียว (Josephine Teo) รัฐมนตรีกระทรวงการสื่อสารและสารสนเทศแห่งสิงคโปร์ เปิดตัว AI Verify - Project Moonshot เวอร์ชันเบต้าเป็นชุดเครื่องมือทดสอบปัญญาประดิษฐ์ ออกแบบมาประเมินความปลอดภัยที่เกี่ยวข้องกับการใช้โมเดลภาษาขนาดใหญ่ (LLM) ซึ่งเป็น Open-source เจ้าแรกๆ ที่สามารถจำลองการโจมตี (red-teaming) การเปรียบเทียบมาตรฐาน และการทดสอบพื้นฐานมารวมกันในแพลตฟอร์มเพื่อรับมือกับความเสี่ยงด้าน AI

Tags:
Node Thumbnail

เทศกาลภาพยนตร์ Tribeca Festival ซึ่งกำหนดจัดขึ้นวันที่ 5-16 มิถุนายนนี้ ที่เมืองนิวยอร์ก ประกาศเซสชันเปิดตัวภาพยนตร์สั้น 5 เรื่อง ที่ผลิตด้วย Sora โมเดล AI สร้างวิดีโอสั้นคุณภาพสูงจาก Text Prompt ของ OpenAI ซึ่งจะเป็นครั้งแรกที่มีการเปิดตัวภาพยนตร์จาก Sora นี้

Jane Rosenthal หนึ่งในผู้จัดงาน Tribeca Festival บอกว่ารากฐานของงาน Tribeca คือการพูดถึงวิธีการเล่าเรื่องที่เปลี่ยนแปลงสิ่งต่าง ๆ ในโลก ซึ่งสามารถผลิตได้บนฟอร์แมตหลากหลายเช่น ภาพยนตร์ขนาดยาว, การสร้างประสบการณ์แนว Immersive, งานศิลปะ ซึ่งหนังสั้นที่สร้างด้วย AI ก็เช่นเดียวกัน

Tags:
Node Thumbnail

Anthropic บริษัทปัญญาประดิษฐ์ผู้พัฒนาโมเดล Claude ประกาศเพิ่มฟีเจอร์ใหม่สำหรับแชทบอตเรียกว่า Tool useให้ผู้ใช้งานสามารถเชื่อมต่อโปรแกรมต่าง ๆ กับ Claude API ได้ หรือนำไปทำแชทบอตแบบคัสตอมนั่นเอง

จุดเด่นของ Claude API คือรองรับอินพุทที่เป็นรูปภาพได้ด้วย จึงสามารถนำไปพัฒนาเครื่องมือวิเคราะห์ข้อมูลจากภาพ ตัวอย่างที่ Anthropic นำเสนอเช่นเป็นแชทบอตแนะนำไอเดียการตกแต่งภายในห้อง โดยถ่ายรูปส่งไปเป็นต้น

ชุด Tool use นี้ สามารถใช้งานได้แล้วตั้งแต่วันนี้ผ่าน Anthropic Messages API, Amazon Bedrock และ Vertex AI บน Google Cloud

ที่มา: Anthropic

Tags:
Node Thumbnail

Mark Gurman แห่ง Bloomberg คนเดิม รายงานข้อมูลล่าสุดที่เขาทราบมาเกี่ยวกับความสามารถใหม่ของ Siri ในระบบปฏิบัติการ iOS 18 ที่แอปเปิลจะเปิดตัวในงาน WWDC เดือนหน้า ซึ่ง มีข่าว ออกมา เรื่อย ๆ ก่อนหน้านี้ว่า Siri จะมีความสามารถที่มากขึ้น รวมทั้งความสามารถด้าน Generative AI

Gurman บอกว่า Siri ตัวใหม่ใน iOS 18 จะมีความสามารถควบคุมจัดการฟังก์ชันต่าง ๆ ในแอปได้มากขึ้น ตัวอย่าง เรียกเปิดเอกสารเฉพาะ, ย้ายบันทึกไปไว้อีกโฟลเดอร์, ส่งเมล, ลบเมล, อีเมลแบบแนบลิงก์, ให้สรุปเนื้อหาเว็บ

Tags:
Node Thumbnail

Mistral บริษัทปัญญาประดิษฐ์จากฝรั่งเศสที่ มีไมโครซอฟท์ถือหุ้นอยู่ด้วย เปิดตัวโมเดล Generative AI ขนาด 22B สำหรับการเขียนโค้ดตัวแรกของบริษัท มีชื่อว่า Codestral

Codestral ถูกเทรนด้วยโค้ดมากกว่า 80 ภาษา ซึ่งรวมทั้งภาษาเขียนโปรแกรมยอดนิยมอย่าง Python, Java, C, C++, JavaScript, และ Bash ไปจนถึงภาษาอย่าง Swift และ Fortran จึงรองรับการทำงานของนักพัฒนาในหลายรูปแบบสถานการณ์ มีความสามารถทั้ง ช่วยเขียนโค้ด เขียนเทสต์ หรือช่วยเติมส่วนที่ขาดหายในโค้ดได้ จึงช่วยลดเวลาและเพิ่มประสิทธิภาพให้กับนักพัฒนาได้

Tags:
Node Thumbnail

Bloomberg รายงานสงคราม AI ฝั่งจีนที่กำลังร้อนแรงในช่วงสัปดาห์ที่ผ่านมา หลังค่าย Alibaba เปิดสงครามราคา หั่นค่าใช้บริการ AI ของตัวเองที่ชื่อ Qwen (ชื่อเต็มคือ Tongyi Qianwen) ลงมากถึง 97% บีบให้คู่แข่งต้องเล่นสงครามราคาตาม

หลังจากนั้นไม่กี่ชั่วโมง ค่าย Baidu ประกาศว่าบริการ Ernie AI บางโมเดลย่อยเปลี่ยนมาให้บริการฟรี และฝั่งค่าย ByteDance ก็ต้องลดราคาโมเดล Doubao 99% ตามมาด้วยเช่นกัน

เมื่อต้นเดือนนี้ Alibaba เพิ่งออก Qwen เวอร์ชัน 2.5 ที่มีความสามารถมากขึ้น อย่างไรก็ตาม การใช้งานโมเดล AI จากฝั่งจีนยังจำกัดเฉพาะบริษัทจีนซะมาก ตัวอย่างลูกค้าที่ Alibaba นำมาโชว์ยังมีเฉพาะบริษัทจีนด้วยกันเอง เช่น Xiaomi และ Perfect World Games

Tags:
Node Thumbnail

หน่วยงานวิจัย Cyberspace Research Institute ของจีน เปิดเผยว่ากำลังพัฒนาโมเดล LLM และตัว AI แบบตอบโต้ โดยอิงจากปัญหาและวิธีคิดของผู้นำ Xi Jinping

โมเดลถูกเทรนด้วยเอกสารของรัฐบาลและหนังสือ "Xi Jinping Thought on Socialism with Chinese Characteristics for a New Era ( 习近平新时代中国特色社会主义思想学习问答 ) ซึ่งเป็นหนังสือปรัชญาการเมืองและอุดมการณ์ของเลขาธิการพรรคคอมมิวนิสต์ โดยตอนนี้ ตัวปัญญาประดิษฐ์หรือแชทบอตยังไม่มีการให้บริการ แต่เปิดทดสอบภายในอยู่

Tags:
Node Thumbnail

กูเกิลทดสอบฟีเจอร์ใช้ Generative AI ช่วยตอบคำถามของผู้ใช้งานผ่านหน้าผลการค้นหามา ตั้งแต่ปีที่แล้ว ซึ่งปัจจุบันเรียกชื่อฟีเจอร์นี้ว่า AI Overviewsและมีแผนขยายบริการนี้ ไปยังผู้ใช้งานทุกคน โดยเริ่มที่สหรัฐอเมริกาในสัปดาห์ที่ผ่านมา จึงทำให้มีรายงานการตอบคำถามของกูเกิลที่ดูไม่ค่อยดีเท่าใดนักออกมา

ผู้ใช้งานคนหนึ่งแชร์คำตอบของคำถามว่า ทำพิซซ่าอย่างไรให้ชีสไม่ไหลหลุดจากแป้ง ซึ่ง AI Overviews ตอบว่าให้ผสมกาวไป 1/8 ถ้วย จะช่วยได้ คำตอบนี้ย่อมไม่ถูกต้องและทำจริงไม่ได้ ที่น่าสนใจคือใน Reddit มีคนค้นพบว่า เคย มีคนตอบแบบนี้เมื่อ 11 ปีที่แล้ว ซึ่งน่าจะเป็นแหล่งข้อมูลที่กูเกิลนำมาใช้ตอบนั่นเอง

Tags:
Node Thumbnail

Khan Academy เว็บไซต์คอร์สออนไลน์ชื่อดัง ประกาศความร่วมมือกับไมโครซอฟท์ เปิดบริการผู้ช่วย AI สำหรับช่วยสอนวิชาการให้นักเรียน ชื่อว่า Khanmigo และเปิดให้บริการฟรี

รูปแบบการทำงานของ Khanmigo ไม่ต่างอะไรจากแชทบอท AI อื่นๆ มากนัก แต่ปรับความเชี่ยวชาญของบอทให้เป็นเหมือนติวเตอร์สอนวิชา มีความรู้ความเชี่ยวชาญในสาขาวิชานั้นๆ เหมือนกับครูคนหนึ่ง เหมือนเป็นผู้ช่วยสอน (TA) ประจำตัวของนักเรียนแต่ละคน สามารถตอบคำถาม ช่วยแนะนำวิธีการทำโจทย์ได้ (ดูคลิปประกอบ)

Tags:
Node Thumbnail

ไมโครซอฟท์เปิดเผยรายละเอียดเบื้องหลัง Copilot+ PC ที่เป็นการนำพีซีพลัง NPU มารันโมเดลปัญญาประดิษฐ์แบบ on-device ภายในเครื่อง ตกลงแล้วโมเดลตัวที่ว่านี้ชื่อว่า Phi Silica (อ่านว่า "ไฟ ซิลิกา") ถือเป็นหนึ่งในเวอร์ชันย่อยของ ชุดโมเดล Phi 3 โดยปรับแต่งมาเพื่อการรันบน NPU โดยเฉพาะ

Phi Silica พัฒนาต่อมาจาก Phi-3-mini โมเดลรุ่นเล็กสุดของซีรีส์ Phi-3 แล้วปรับขนาดให้เล็กลงอีกหน่อย (ขนาดพารามิเตอร์ลดลงจาก 3.8B เหลือ 3.3B) เพื่อให้รันใน NPU ได้พอดี ศักยภาพของ Phi Silica รองรับอินพุต 650 token ต่อวินาที ใช้พลังงานเพียง 1.5 วัตต์เท่านั้น

Tags:
Node Thumbnail

ในงาน Build 2024 เมื่อคืนนี้ ไมโครซอฟท์เปิดตัวโมเดลขนาดเล็ก Phi 3 ครบชุด หลังจาก เปิดตัว Phi-3-mini มาตั้งแต่เดือนเมษายน

โมเดลในชุด Phi 3 มีด้วยกันทั้งหมด 4 ตัว เป็นโมเดลภาษา (small language model หรือ SML) จำนวน 3 ขนาด พ่วงด้วยของใหม่คือโมเดลภาพ (multimodal) ตัวแรกของไมโครซอฟท์ที่เปิดซอร์สออกมาคือ Phi-3-vision

Tags:
Node Thumbnail

IBM ประกาศโอเพนซอร์สโมเดลช่วยเขียนโค้ดของตัวเองชื่อ Granite โดยบอกว่ามีประสิทธิภาพเหนือกว่าโมเดลโอเพนซอร์สคู่แข่งในขนาดใกล้เคียงกัน (7B-8B) เช่น Google Gemma หรือ Meta CodeLlama

Granite เป็นโมเดลที่อยู่เบื้องหลัง บริการ Watsonx Code Assistant (WCA) ที่เปิดตัวเมื่อปีที่แล้ว และนำไปใช้งานกับโค้ด COBOL ในเมนเฟรม Z หรือ Ansible Lightspeed ของฝั่ง Red Hat

Tags:
Node Thumbnail

ประเด็นที่ OpenAI ประกาศ หยุดให้บริการเสียงพูด Sky ใน ChatGPT ชั่วคราว เนื่องจากถูกตั้งข้อสงสัยว่าเสียงเหมือนกับนักแสดง Scarlett Johansson แม้ทาง OpenAI ยืนยันว่าใช้เสียงนักพากย์มืออาชีพ ที่อาจจะออกมาเหมือน แต่ยืนยันว่าไม่ได้ตั้งใจเลียนแบบ ดูเหมือนจะมีอะไรที่ซับซ้อนมากกว่านั้น

Tags:
Topics: 
Node Thumbnail

OpenAI มีฟังก์ชัน Voice Mode ใน ChatGPT ให้ใช้งาน ตั้งแต่กันยายน ปีที่แล้ว ซึ่ง ChatGPT สามารถโต้ตอบเป็นเสียงพูดได้ โดยระบุว่าเสียงที่ออกมานั้นใช้นักพากย์มืออาชีพ

อย่างไรก็ตามในตัวเลือก 5 เสียงที่มีให้ใช้งานได้แก่ Breeze, Cove, Ember, Juniper และ Sky ตัวเลือกเสียงอันหลังสุด Sky กลายเป็นประเด็นเมื่อมีคนตั้งข้อสงสัยว่าน้ำเสียงนั้นคล้ายกับนักแสดง Scarlett Johansson (Natasha Romanoff ใน Black Widow)

OpenAI ยืนยันว่าเสียงของ Sky เป็นของนักพากย์มืออาชีพหญิงคนหนึ่ง ที่พูดแบบธรรมชาติ และไม่ใช่ Scarlett Johansson แต่จะไม่เปิดเผยตัวตนเพื่อความเป็นส่วนตัว โดย OpenAI จะเริ่มปิดการใช้งานเสียง Sky ชั่วคราวเพื่อตรวจสอบเรื่องนี้เพิ่มเติม

Tags:
Node Thumbnail

ในงาน Google I/O 2024 ของใหม่อย่างหนึ่งที่เรียกเสียงฮือฮาในงานคือการโชว์โมเดล Gemini Nano รันในมือถือแอนดรอยด์โดยตรง ทำงานออฟไลน์ แล้วสามารถตรวจสอบการสนทนาที่เป็น scam หลอกหลวงได้ เป็นการโชว์ประโยชน์ของการรันโมเดลในมือถือให้เห็นชัดๆ ว่าทำอะไรได้บ้าง

หลังจากนั้นกูเกิลยังได้ออกวิดีโอเซสชัน Android on-device AI under the hood มาอธิบายรายละเอียดของการรันโมเดลในมือถือแอนดรอยด์เพิ่มเติม มีรายละเอียดดังนี้

Tags:
Node Thumbnail

OpenAI ประกาศเพิ่มปรับปรุงเครื่องมือวิเคราะห์ข้อมูลใน ChatGPT โดยรองรับการเพิ่มไฟล์โดยตรงจาก Google Drive และ Microsoft OneDrive แล้ว (ได้ทั้งคู่นะ ไม่เหมือนแอปเดสก์ท็อป )

ฟังก์ชันเพิ่มไฟล์โดยตรงจาก Google Drive หรือ Microsoft OneDrive รองรับไฟล์ในหลายฟอร์แมตทั้งเอกสาร, สเปรดซีต หรือสไลด์นำเสนอข้อมูล สามารถขยายพื้นที่ของไฟล์ในหน้า ChatGPT เพื่อดูข้อมูลประกอบได้ รองรับข้อมูลที่ถูกปรับปรุงเรียลไทม์ในระหว่างการสนทนาวิเคราะห์ข้อมูล

Tags:
Topics: 
Node Thumbnail

กูเกิลเปิดโครงการทดลอง Built-in AI เตรียมนำ Gemini Nano มารันใน Chrome โดยตรง เปิดทางให้เบราว์เซอร์มี API ในกลุ่ม LLM เพิ่มเติม

ฟีเจอร์ที่เว็บไซต์จะสามารถใช้งาน LLM บนเว็บได้ เช่น การช่วยสรุป หรือถามตอบคำถามในเนื้อหาบนเว็บเอง ไปจนถึงการเป็นตัวช่วยผู้ใช้เขียนเนื้อหา หรือตรวจคำผิด

ทุกวันนี้เว็บไซต์หลายแห่งรันโมเดลปัญญาประดิษฐ์บนเว็บอยู่แล้ว แต่การใช้งานแบบทุกวันนี้ทำให้ผู้ใช้ต้องดาวน์โหลดไฟล์ขนาดนับร้อยเมกะไบต์ทุกเว็บ และอาจใช้งานฟีเจอร์ต่างๆ ของเครื่องเช่น GPU หรือ NPU ได้จำกัด การที่เบราว์เซอร์มี API โดยตรงให้เลยจะทำให้ออปติไมซ์ได้ดีขึ้น

Tags:
Topics: 
Node Thumbnail

กูเกิลโชว์ Gemini Nano โมเดลปัญญาประดิษฐ์สำหรับโทรศัพท์รุ่นใหม่รองรับอินพุตหลายรูปแบบทั้งภาพ, เสียง, และข้อความ พร้อมกับความสามารถของแอป Gemini ที่ผูกเข้ากับระบบของแอนดรอยด์เต็มตัว

Gemini Nano อ่านภาพได้ ทำให้สามารถบรรยายภาพได้โดยไม่ต้องมีข้อมูลล่วงหน้า กูเกิลใส่ความสามารถนี้ในฟีเจอร์ TalkBack ที่ช่วยผู้มองเห็นได้จำกัด ทำให้สามารถบรรยายภาพได้อย่างละเอียด นอกจากนี้ยังสามารถฟังเสียงได้ ทำให้สามารถฟังเสียงการสนทนาตลอดเวลาและแจ้งเตือนทันทีเมื่อพบว่าบทสนนนาน่าจะเป็นการหลอกลวง ฟีเจอร์นี้จะเป็นแบบ opt-in ต้องเปิดใช้งานเอง และจะเปิดให้ใช้ภายในปีนี้ (ไม่ระบุประเทศที่รองรับ)

Tags:
Topics: 
Node Thumbnail

กูเกิลอัพเดต Gemini Advanced เวอร์ชั่นผู้ใช้ทั่วไป เป็น Gemini 1.5 Pro ทำให้รองรับ context window ขนาด 1 ล้านโทเค็นแบบเดียวกับการใช้งานแบบเดียวกับการใช้งานผ่าน API รองรับการอัพโหลดข้อมูลขนาดใหญ่เข้าไปยังแชตได้โดยตรง โดยมีฟีเจอร์ใหม่หลักๆ ได้แก่

Tags:
Topics: 
Node Thumbnail

กูเกิลอัพเดตโมเดล Gemini 1.5 Pro โดยขยาย context window เป็น 2 ล้านโทเค็น ทำให้สามารถรองรับข้อมูลขนาดใหญ่มาก และเชื่อฟังคำสั่งมากขึ้น โดยเฉพาะคำสั่งฟอร์แมต์เอาท์พุต หรือพฤติกรรมของ AI และการวางแผนการทำงานได้ดีขึ้นทำให้สามารถเรียกฟังก์ชั่นภายนอกได้มากขึ้น

นอกจากนี้กูเกิลยังเปิดตัว Gemini 1.5 Flash ที่ราคาประหยัดลงแต่ประสิทธิภาพยังใกล้เคียง Gemini 1.5 Pro โดยอาศัยเทคนิค distillation ที่ดึงความสามารถจากโมเดลขนาดใหญ่ และรองรับ context window ขนาด 1 ล้านโทเค็นเท่ากับรุ่นใหญ่ ราคาค่าใช้งาน 0.35 ดอลลาร์ต่อล้านโทเค็น

Gemini 1.5 Pro และ 1.5 Flash เปิดให้ใช้งานได้ทั้งทาง Google AI Studio และ Vertex AI ส่วนเวอร์ชั่น 2 ล้านโทเค็นยังทดสอบวงปิดต้องขอใช้งาน

Tags:
Topics: 
Node Thumbnail

เมื่อคืนที่ผ่านมา OpenAI เปิดตัว GPT-4o พร้อมกับประกาศเปลี่ยน tokenizer ใหม่โดยอาศัย 20 ภาษาต้นแบบในการบีบอัดข้อมูล ทำให้ภาษาต่างๆ ประหยัดโทเค็นยิ่งขึ้น แม้ภาษาไทยจะไม่อยู่ในรายชื่อ 20 ภาษา แต่ผลการทดลองก็พบว่าภาษาไทยนั้นประหยัดโทเค็นลงเท่าตัว

tokenizer ของ GPT-4o สามารถจับคำหรือส่วนของคำในภาษาไทยได้ชัดเจน คำสามัญเช่น "ของ" หรือ "จำนวน" ก็สามารถมองเป็นโทเค็นเดียวได้ทันที เทียบกับ tokenizer ของ GPT-4 ที่ไม่สามารถรวบตัวอักษรหลายตัวในภาษาไทยเข้าด้วยกันได้เลย ทำให้จำนวนโทเค็นกับจำนวนตัวอักษรใกล้เคียงกัน

Pages