Large Language Model

Tags:
Node Thumbnail

กูเกิลปล่อย Gemini Ultra 1.0 โมเดลรุ่นใหญ่ที่สุดในตระกูล Gemini ที่ กูเกิลระบุว่าคะแนนทดสอบสูงกว่า GPT-4 โดยเปิดบริการ Gemini Advanced ให้ผู้ใช้ Google One แพ็กเกจระดับ AI Premium ที่มาพร้อมพื้นที่เก็บข้อมูล 2TB ราคา เดือนละ 750 บาท พร้อมช่วงทดสอบฟรีสองเดือน

ราคานี้ใกล้เคียงกับ Copilot Pro ของไมโครซอฟท์ ที่เปิดให้ผู้ใช้ทั่วไปซื้อแพ็กเกจ GPT-4 ใช้งาน แต่ถูกกว่า Copilot for Microsoft 365 สำหรับลูกค้าองค์กรที่ราคา 30 ดอลลาร์ต่อเดือน

Tags:
Node Thumbnail

แอปเปิลเผยแพร่งานวิจัยด้าน AI ต่อสาธารณะ โดยเป็นโมเดลโอเพนซอร์ส ที่สามารถแก้ไขรูปภาพได้ตามคำสั่งภาษาธรรมชาติ (Natural Language) ซึ่งพัฒนาและวิจัยโดยทีมวิจัยของแอปเปิล ร่วมกับทีมนักวิจัยจาก University of California, Santa Barbara

โมเดล AI ตัวนี้มีชื่อว่า "MGIE" ย่อมาจาก MLLM-Guided Image Editing โดยนำโมเดลข้อมูลผสมผสานภาษาขนาดใหญ่ มาต่อยอดให้รับคำสั่งเพื่อแก้ไขรูปภาพในหลายแบบ ทั้งระดับเล็กที่พิกเซล จนถึงการแก้ไขภาพรวม

Tags:
Node Thumbnail

Roblox เปิดตัวโมเดล AI ปรับแต่งที่รองรับการแปลข้อความในแชทภาษาต่าง ๆ แบบเรียลไทม์ โดยมีเป้าหมายให้การสนทนาลื่นไหลแบบที่ผู้เล่นไม่ทราบด้วยว่าคู่สนทนาจริง ๆ แชทมาด้วยภาษาอะไร

AI แปลภาษาใน Roblox รองรับการแปลทั้ง 16 ภาษา ซึ่งรวมทั้งภาษาไทยด้วย ส่วนภาษาอื่นเช่น ภาษาอังกฤษ ภาษาสเปน ภาษาฝรั่งเศส ภาษาเยอรมนี ภาษาอินโดนีเซีย ภาษาจีนทั้ง Simplified และ Traditional ภาษาญี่ปุ่น ภาษาเกาหลี ภาษาเวียดนาม ฯลฯ

Tags:
Node Thumbnail

ChatDB ปล่อยโมเดลปัญญาประดิษฐ์ Natural-SQL-7B โมเดลสำหรับเขียน SQL ตามคำสั่ง โดยชูจุดเด่นที่โมเดลมีขนาดเล็กมาก เพียง 7 พันล้านพารามิเตอร์แต่ได้ผลลัพธ์ค่อนข้างดี เหนือกว่า GPT-3.5 เสียอีก

คะแนนทดสอบ SQL-Eval ที่อาศัยการทดสอบคิวรีจริงด้วย PostgreSQL และ Snowflake ได้คะแนน 76.5% เป็นรอง SQLCoder-15B ที่ได้ 78% และ GPT-4 ที่ได้ 83%

ตัวโมเดลเปิดให้ใช้งานได้ฟรีแต่บังคับต้องเปิดเผยโมเดลที่ถูกดัดแปลงแบบเดียวกับ Creative Commons BY-SA 4.0 แต่เพิ่มเงื่อนไขจำกัดประเภทธุรกิจที่ใช้งานได้ทำให้ไม่เป็นโอเพนซอร์ส

ที่มา - HuggingFace: ChatDB/Natural-SQL-7B

Tags:
Node Thumbnail

Amazon เปิดตัว Rufusแชทบอตผู้ช่วยพลัง Generative AI ที่ช่วยให้การเลือกค้นหาสินค้าทำได้ผ่านการสนทนาโต้ตอบอัตโนมัติ

ถ้าอธิบายการทำงาน Rufus ก็อาจสรุปได้ว่าเป็นแชทบอตสไตล์ ChatGPT ที่เชี่ยวชาญรายการสินค้าที่มีทั้งหมดใน Amazon รวมทั้งแนะนำให้ข้อมูลต่าง ๆ ได้ ข้อดีของ Rufus คือช่วยฟิลเตอร์สินค้า เจาะจงรายละเอียดได้มากเท่าที่ลูกค้าต้องการระบุ มากกว่าวิธีกรองสินค้าแบบเดิมนั่นเอง

Rufus เริ่มทดสอบวันนี้ในสถานะเบต้าบนแอป Amazon ในมือถือ เริ่มทดลองกับลูกค้ากลุ่มเล็กก่อน และจะขยายออกไปยังลูกค้าทุกคนในสหรัฐอเมริกาต่อไป

ที่มา: Amazon

Tags:
Topics: 
Node Thumbnail

กูเกิลประกาศเพิ่มฟีเจอร์ใหม่ด้าน Generative AI ให้กับบริการ Google Maps ส่วนของการค้นหาสถานที่ใหม่ที่น่าสนใจ ซึ่งกูเกิลบอกว่าเป็นการนำข้อมูลสถานที่กว่า 250 ล้านแห่ง และข้อมูลจากชุมชนมาประมวลผลด้วย LLM

ฟีเจอร์ Generative AI ใน Google Maps จะเริ่มเปิดใช้งานสำหรับผู้ใช้งานในสหรัฐอเมริกาก่อน ในส่วน Local Guides โดยสามารถค้นหาด้วยคำถามแบบกว้าง ๆ เพื่อขอไอเดีย เช่น เที่ยงนี้กินอะไรดี หรือเจาะจงหมวดของร้านให้ Maps แนะนำออกมาก็ทำได้เช่นกัน

สถานะของ Local Guides แบบใหม่นี้ยังอยู่ในขั้นทดสอบ แต่กูเกิลคาดหวังว่าจะสามารถเปลี่ยนวิธีใช้งาน Maps ไปอีกขั้นหนึ่งได้

ที่มา: กูเกิล

Tags:
Node Thumbnail

กูเกิลปล่อย Gemini Pro ใน Bard ทุกภาษาแล้ว หลังจากเมื่อปีที่แล้วจำกัดเฉพาะภาษาอังกฤษ ส่วนภาษาอื่นๆ ยังใช้ PaLM-2 มาตลอด การเปลี่ยนแปลงครั้งนี้ทำให้ Bard สามารถสรุป, ทำความเข้าใจ, และให้เหตุผลได้ดีขึ้น

นอกจากการเปลี่ยนโมเดลด้านหลังแล้ว Bard ยังเพิ่มอีกสองฟีเจอร์ ได้แก่

  • สร้างภาพด้วย Imagen2 ในตัว ด้วยการพิมพ์ลงพรอมพ์แชตตามปกติ ภาพที่สร้างขึ้นจะถูกฝังลายน้ำ SynthID เอาไว้ ตอนนี้ยังสั่งได้เฉพาะภาษาอังกฤษเท่านั้น
  • ตรวจคำตอบด้วย Google Search รองรับภาษาเพิ่มเติม

กูเกิลชูประเด็นที่ Bard ได้คะแนนสูงใน LMSYS ว่ายืนยันผลทดสอบที่กูเกิลจ้างบริษัทภายนอกมาสำรวจก่อนหน้านี้

Tags:
Topics: 
Node Thumbnail

Meta ปล่อยโมเดล Code Llama ขนาด 70B หลังจากปีที่แล้วปล่อยรุ่นใหญ่สุดอยู่ที่ 34B เท่านั้น โดยตอนนี้ยังไม่บอกรายละเอียดนัก นอกจากระบุว่า คะแนนทดสอบ HumanEval อยู่ที่ 67.8 แซงหน้า GPT-4 (67.0) และ Gemini Pro (67.7) โดยระบบอื่นๆ ที่ได้คะแนนสูงกว่านี้มักใช้ GPT-4/GPT-3.5 ร่วมกับเทคนิคอื่นๆ เพื่อให้ทำคะแนนได้สูงขึ้น

โมเดลที่ปล่อยออกมามี 3 รุ่นย่อย ได้แก่ รุ่นพื้นฐานสำหรับใช้งานทั่วไป, รุ่นภาษาไพธอนโดยเฉพาะ, และรุ่น Instruct สำหรับรับคำสั่งเพื่อเขียนโปรแกรมตาม รุ่นที่รายงานคะแนน HumanEval นั้นคือรุ่น Instruct

โมเดลเหล่านี้ใช้งานได้ฟรีแบบมีข้อจำกัด โดยห้ามใช้งานกับองค์กรที่มีผู้ใช้เกิน 700 ล้านคนต่อเดือน

Tags:
Node Thumbnail

LMSYS ผู้จัดอันดับแชตบอทโดยอาศัย Chatbot Arena เป็นการ "ต่อสู้" ระหว่างแชตบอทสองตัวให้ตอบคำถามเดียวกันแล้วให้ผู้ใช้เลือกว่าชอบคำตอบฝั่งใด รายงานผลรอบล่าสุดวันที่ 26 มกราคม 2024 และพบว่า Bard รุ่นที่ใช้ Gemini Pro นั้นแซงหน้า GPT-4 ขึ้นมาเป็นรองเพียง GPT-4 Turbo เท่านั้น

กูเกิลเปิดตัว Gemini โดยระบุว่าทดสอบวงปิดกับผู้ทดอบแล้วว่า Bard รุ่นใหม่นี้เป็นแชตบอทฟรีที่คุณภาพสูงสุดในตลาด ผลการทดลองนี้ก็ดูจะสนับสนุนว่า Gemini ให้ผลโดยรวมที่ดีในภาพรวมจริงๆ

Tags:
Node Thumbnail

Baidu ประกาศความร่วมมือ นำความสามารถด้าน AI ใส่ใน Samsung Galaxy S24 รุ่นที่ขายในจีน ซึ่งจะใช้ แชทบอต Ernie ของ Baidu ที่มีฟีเจอร์ทั้งการแปลภาษาระหว่างสนทนาแบบเรียลไทม์ และฟีเจอร์อื่นเช่น การแปลภาษาและสรุปเนื้อหา Note Assistant

การเข้ามาร่วมมือของ Baidu นี้มีความน่าสนใจ เพราะปัจจุบันในตลาดจีนซัมซุงเป็นสมาร์ทโฟนที่ไม่ติดใน 5 อันดับแรก ขณะที่ แอปเปิลเป็นอันดับ 1 ในปีล่าสุด

แชทบอต Ernie ของ Baidu มีรายงานจำนวนผู้ใช้งานเมื่อปลายปีที่แล้วมากกว่า 100 ล้านคน โดยมีคู่แข่ง AI สร้างเนื้อหา จากบริษัทเทคโนโลยีรายใหญ่ในจีนคือ Hunyuan ของ Tencent และ Tongyi Qianwen ของ Alibaba

Tags:
Topics: 
Node Thumbnail

OpenAI ประกาศอัพเดตโมเดลทั้ง LLM และ embedding โดย LLM นั้นเป็นการปรับตามรอบเป็นเวอร์ชั่น 0125 พร้อมกับลดราคาบางส่วน

โมเดล embedding ของ OpenAI ที่ผ่านมาเป็นโมเดล Ada ที่ใช้งานมานาน และมีขนาดเวคเตอร์ขาออกถึง 1536 มิติ ในโมเดล text-embedding-3 จะมีขนาดเวคเตอร์ให้เลือกตั้งแต่ 256, 512, 1024, 1536, 3072 มิติ โดยเวคเตอร์ขนาดเล็กที่สุดก็ยังมีคะแนน ดีกว่า Ada ตัวเดิม

โมเดล GPT-3.5 Turbo ปรับเวอร์ชั่นเป็น 0125 แก้บั๊กการเรียกฟังก์ชั่นด้วยภาษาอื่นนอกจากภาษาอังกฤษ ขณะที่โมเดล GPT-4 แก้ปัญหาโมเดล "ขี้เกียจ" ไม่ยอมทำงานตามที่สั่ง และแก้ปัญหาการตอบภาษาอื่นนอกจากภาษาอังกฤษเช่นกัน

Tags:
Node Thumbnail

Google Research เปิดตัว Lumiere โมเดล AI สำหรับสร้างวิดีโอขึ้นจาก Prompt ตัวหนังสือ หรือรูปภาพต้นแบบ มีจุดเด่นคือโมเดลทำงาน โดยดูองค์ประกอบในภาพข้อมูลตั้งต้น และสร้างวิดีโอต่อเนื่องขึ้นจากสิ่งเหล่านั้น ทำให้รักษาภาพรวมและสไตล์ไว้ได้มากกว่าโมเดลอื่น

ตัวอย่างวิดีโอที่สร้างขึ้นมาจาก Lumiere มีหลายรูปแบบทั้ง Text-to-Video สร้างคลิปสั้นตามข้อความอินพุท, Image-to-Video ให้รูปภาพตั้งต้นแล้วใส่อินพุทสิ่งที่ต้องการให้ภาพเคลื่อนไหว, Stylized Generation กำหนดภาพรูปแบบตั้งต้น แล้วสร้างผลลัพธ์ตามอินพุทที่ต้องการให้ได้โทนเดียวกัน

Tags:
Node Thumbnail

Ollama ซอฟต์แวร์สำหรับรันโมเดลปัญญาประดิษฐ์ในกลุ่ม LLM ปล่อยไลบรารีสำหรับพัฒนาแอปพลิเคชั่นบนภาษา Python และ JavaScript จากเดิมที่ต้องเขียน REST API โดยตรง

ไลบรารีทั้งสองตัวรองรับฟีเจอร์ของ Ollama ครบชุด ได้แก่ streaming สำหรับการคืนคำตอบทีละส่วน, multi-modal ใส่ภาพเป็นอินพุต, text completion สำหรับถามตอบปกติ, และ custom models สำหรับการกำหนด system prompt ด้วยตัวเอง

แนวทางการรัน LLM บนเครื่องไคลเอนต์เริ่มได้รับความสนใจมากขึ้นเรื่อยๆ เพราะไม่ต้องเสียค่าใช้จ่าย, คาดเดาระยะเวลารันได้แน่นอน, และโมเดลขนาดเล็กก็เริ่มมีประสิทธิภาพดีขึ้นในช่วงหลังๆ เช่น ไมโครซอฟท์เองก็เพิ่งปล่อยโมเดล Phi-2 ออกมา

Tags:
Node Thumbnail

Google Arts & Culture ประกาศอัพเดตฟีเจอร์ Art Selfie ที่แปลงรูปถ่ายเซลฟี่ให้เป็นภาพงานศิลปะหรือฉากอื่น ๆ โดยเวอร์ชันใหม่ Art Selfie 2นี้ เป็นการแปลงภาพถ่ายด้วยพลัง Generative AI มีทั้งทำให้เป็นภาพฉากหลังเขาเอเวอเรสต์, บรรยากาศใน Monet's Garden และอื่น ๆ ซึ่งตอนนี้มีให้เลือกมากกว่า 25 รูปแบบ และจะเพิ่มเติมอีกในอนาคต

Tags:
Node Thumbnail

กูเกิลประกาศเพิ่มฟีเจอร์ให้กับ Google Chrome โดยอาศัยพลัง generative AI 3 รายการ โดยเฉพาะการเพิ่มฟีเจอร์ช่วยเขียนและสร้างภาพ แบบเดียวกับที่ Microsoft Edge ใส่ Copilot เข้ามา โดย 3 ฟีเจอร์ได้แก่

Tags:
Node Thumbnail

Stability AI บริษัทเจ้าของโมเดลสร้างภาพ Stable Diffusion เปิดตัวโมเดลภาษาเวอร์ชันใหม่ Stable LM 2 ซึ่งเป็นเวอร์ชันปรับปรุงจาก Stable LM เวอร์ชันแรกที่เปิดตัวในเดือนเมษายน 2023

ความน่าสนใจของ Stable LM 2 คือตัวโมเดลมีขนาดเล็กลงเหลือเพียง 1.6 พันล้านพารามิเตอร์ (เวอร์ชันแรกเริ่มต้น 3 ล้านพารามิเตอร์) ถือเป็นโมเดลภาษาขนาดเล็ก small language model (SLM) ที่นำไปรันบนฮาร์ดแวร์สเปกต่ำได้กว้างขวางกว่าโมเดลภาษาขนาดใหญ่ (LLM)

Tags:
Node Thumbnail

Mark Zuckerberg เปิดเผยว่าตอนนี้ทีม AI ของบริษัท Meta กำลังเทรนโมเดล Llama 3 บนโครงสร้างพื้นฐานคอมพิวเตอร์ขนาดใหญ่ ที่จะมีจีพียู NVIDIA H100 เพิ่มเป็น 350,000 ตัวภายในสิ้นปี 2024 และถ้านับจีพียูตัวอื่นๆ มารวมด้วย จะเทียบได้กับการมี H100 จำนวนรวม 600,000 ตัว

ตอนนี้ Meta มีทีมพัฒนา AI สองทีมคือ Fundamental AI Research (FAIR) ที่เน้นงานวิจัย และ GenAI ที่เพิ่งตั้งเมื่อต้นปี 2023 เน้นพัฒนาฟีเจอร์ AI ให้กับบริการในเครือ อย่าง WhatsApp, Messenger, Instagram

Tags:
Node Thumbnail

LangChain เปิดตัวเฟรมเวิร์กเวอร์ชัน 0.1.0 แล้ว หลังจากพัฒนามา 1 ปี

LangChain เป็นเฟรมเวิร์กโอเพนซอร์สยอดนิยมที่ออกแบบมาเพื่อช่วยสร้างแอปที่ใช้ LLM โดยเวอร์ชันนี้จะมีทั้ง Python และ JavaScript ซึ่งเป็นการปรับปรุงและเพิ่มความสามารถต่าง ๆ ดังนี้

Tags:
Node Thumbnail

DeepLearning.AI แพลตฟอร์มการเรียนรู้ AI และ Deep Learning ที่ก่อตั้งโดย Andrew Ng เปิดตัวหลักสูตรระยะสั้น Generative AI ในภาษา JavaScript ฟรีในช่วงเวลาจำกัด สอนการสร้างแอป LLM ด้วย LangChain โดย Jacob Lee วิศวกรซอฟต์แวร์ผู้ก่อตั้งและหัวหน้าผู้ดูแลโครงการ LangChain.js ใช้เวลาเรียน 1 ชม. เหมาะสำหรับนักพัฒนาเว็บที่มีพื้นฐานเกี่ยวกับ JavaScript ระดับกลาง

Tags:
Node Thumbnail

Parag Agrawal อดีตซีอีโอเชื้อสายอินเดียของ Twitter ที่ลงจากตำแหน่ง หลัง Elon Musk ซื้อกิจการแล้วปลดออกเป็นคนแรก หลังจากนั้นเขาก็เงียบหายไปเลย (โพสต์สุดท้ายใน บัญชีทวิตเตอร์ @paraga เมื่อเดือนตุลาคม 2022)

ล่าสุดเว็บไซต์ Information รายงานว่า Parag กำลังตั้งบริษัทสตาร์ตอัพด้าน AI โดยหาเงินทุนก้อนแรกมูลค่า 30 ล้านดอลลาร์ได้แล้ว จากกลุ่มนักลงทุนที่มี Khosla Ventures เป็นนักลงทุนหลัก

ตอนนี้ยังไม่มีข้อมูลชื่อบริษัทใหม่ของ Parag ว่าชื่ออะไร รู้แค่ว่าเป็นบริษัททำเกี่ยวกับ large language model (LLM)

Tags:
Node Thumbnail

OpenAI ออกมาเขียนบล็อกชี้แจงกรณี The New York Times (NYT) ยื่นฟ้องละเมิดลิขสิทธิ์ โดยระบุว่าเป็นบั๊กที่เกิดได้ยากแล้ว และกำลังแก้ไขให้ไม่มีเหตุการณ์แบบนี้อีก พร้อมกับยืนยันว่าต้องการเป็นพันธมิตรกับสำนักข่าวต่างๆ

Tags:
Topics: 
Node Thumbnail

หลัง Google เปิดตัว Gemini 1.0 โดยมี 3 เวอร์ชันคือ Nano ที่ใช้ใน Pixel แล้ว , Pro ที่ใช้ใน Bard และ Ultra ที่กำลังจะใช้บน Bard Advanced และจะเปิดตัวในปีนี้

ล่าสุดมีนักพัฒนาค้นพบว่า Bard Advanced จะเป็นแบบเสียเงิน (แบบเดียวกับ GPT Plus) โดยจะผูกอยู่กับบริการ Google One ซึ่งช่วงแรกจะเป็นการให้ทดลองใช้ฟรี 3 เดือน

ที่มา - @bedros_p , @evowizz

Tags:
Node Thumbnail

Wang Haifeng ซีทีโอ Baidu เปิดเผยว่าแชทบอต ERNIE ตอนนี้มีผู้ใช้งานรวมมากกว่า 100 ล้านบัญชีแล้ว หลังจาก ERNIE เปิดให้ใช้งาน แบบสาธารณะตั้งแต่ต้นเดือนกันยายนที่ผ่านมา

Baidu เปิดตัว ERNIE มาตั้งแต่ เดือนมีนาคม ซึ่งเป็นเวลาไม่นานหลังจากกระแส ChatGPT ของ OpenAI มีมากขึ้น ในช่วงแรก Baidu ยังเปิดให้ใช้งาน ERNIE แบบ ทดสอบจำกัดกลุ่ม เฉพาะบริษัทที่ได้รับอนุญาต เนื่องจากกระแสตอบรับมีสูงมาก

Tags:
Node Thumbnail

หนังสือพิมพ์ The New York Times (NYT) ยื่นฟ้องไมโครซอฟท์และ OpenAI ฐานใช้งานบทความของหนังสือพิมพ์โดยไม่ได้รับอนุญาต ทั้งการใช้งานไปในชุดข้อมูลสำหรับฝึก LLM และตัว ChatGPT/Copilot เองก็ตอบบทความแทบทั้งบทความของ NYT ออกมาให้ผู้ใช้ได้

Tags:
Node Thumbnail

แอปเปิลเผยแพร่ Ferretโมเดล AI ภาษาขนาดใหญ่บนข้อมูลสื่อผสม (Multimodal Large Language Model - MLLM) ใน GitHub ซึ่งพบว่าปล่อยออกมาตั้งแต่ 30 ตุลาคม แต่เพิ่งถูกพบและรายงานข่าวออกมา

Ferret มีจุดเด่นคือความสามารถการแยกข้อมูลภาพในรูปทรง-พื้นที่ใดก็ได้ แล้วให้รายละเอียดเจาะเฉพาะส่วนที่เห็น ตัวอย่างที่นำเสนอ เช่น สามารถระบุพื้นที่หางแมวได้ หรือรูปที่มีสัตว์ 2 ตัวซ้อนกัน ก็แยกตัวที่ 1 กับตัวที่ 2 ได้

Pages