LLM | Blognone

Large Language Model

Alibaba Cloud เปิดตัวปัญญาประดิษฐ์ Qwen2 ใช้งานได้เสรี พร้อมรองรับภาษาไทย

By: lew

on 7 June 2024 - 01:24 Tags:

Topics:

Alibaba Cloud

LLM

Open Source

ทีมวิจัย Qwen ของ Alibaba Cloud เปิดตัวโมเดล LLM ในชื่อ Qwen2 มี 5 ขนาดให้เลือกตั้งแต่ 0.5B, 1.5B, 7B, 14B, และ 72B โดยชูจุดเด่นรองรับภาษาอื่นๆ นอกจากภาษาอังกฤษ เช่นแถบเอเชียตะวันออกเฉียงใต้นั้นรองรับทั้ง ไทย, เวียดนาม, อินโดนีเซีย, เมียนมาร์, ลาว, กัมพูชา และยังรองรับ context window ถึง 128K

ผลทดสอบยอดนิยมเช่น MMLU หรือ HumanEval นั้น Qwen2-72B ทำได้เหนือกว่า Llama3-70B ไปเล็กน้อย ขณะที่ Qwen2-7B ก็เอาชนะ Llama3-7B ได้หลายชุดทดสอบโดยเฉพาะชุดทดสอบ HumanEval ที่คะแนนนำค่อนข้างมาก

Qwen2 ปล่อยให้ใช้งานแบบ Apache 2.0 ยกเว้นเฉพาะ Qwen2-72B เท่านั้นที่ยังจำกัดการใช้งานแบบ Qianwen License ทำให้โมเดลขนาด 7B สามารถใช้งานได้แทบไม่มีข้อจำกัด

กูเกิลเปิดบริการ NotebookLM แอปทำสรุปโน้ตพลัง Gemini นอกสหรัฐฯ คนไทยได้ใช้ด้วย

By: lew

on 6 June 2024 - 18:48 Tags:

Topics:

Gemini

Google

LLM

กูเกิล ขยายบริการ NotebookLM แอปจดโน้ตพลัง Gemini 1.5 Pro ที่ช่วยผู้ใช้เขียนรายงานได้อย่างรวดเร็ว หลังจากเปิดตัวเฉพาะในสหรัฐฯ ช่วงปลายปี 2023 โดยตอนนี้ใช้ Gemini 1.5 Pro ทำให้รองรับการอ่านรูปภาพ สามารถอ้างอิงข้อมูลในภาพของเอกสารที่ใส่เข้าไปได้

แนวทางการใช้งานสร้างเอกสาร เช่น การสร้างคำถามที่พบบ่อย, เอกสารสรุปย่อการประชุม, หรือบทเรียน โดยหลักๆ แล้ว NotebookLM เป็นการพูดคุยกับ Gemini โดยอาศัยเอกสารที่ผู้ใช้มอบให้เป็นหลัก ทำให้แน่ใจได้ว่าการพูดคุยนั้นอยู่ในประเด็นที่ต้องการ

aCommerce อาศัย Generative AI บน AWS เปิดให้ลูกค้าถามข้อมูลธุรกิจด้วยตัวเอง

By: lew

on 5 June 2024 - 00:05 Tags:

Topics:

aCommerce

AWS

LLM

ในงาน AWS Summit ที่กรุงเทพสัปดาห์ที่ผ่านมา aCommerce ผู้ให้บริการอีคอมเมิร์ชกับแบรนด์ต่างๆ เปิดตัวบริการในชุดโปรแกรม Market Insight ที่เปิดให้ลูกค้าสามารถสำรวจข้อมูลเชิงลึกทางธุรกิจได้ตามมุมมองที่ตนเองต้องการ

Market Insight เป็นการรวบรวมข้อมูลอีคอมเมิร์ชจากแหล่งต่างๆ รวมกว่าแสนล้านชุดข้อมูล เปิดทางให้ธุรกิจสามารถวิเคราะห์การแข่งขัน เช่น ราคาคู่แข่ง, เทรนด์สินค้าใหม่ๆ, หรือกระทั่งมอนิเตอร์ว่าสินค้าของแบรนด์ตนเองว่ามีการขายในราคาที่ผิดปกติหรือไม่ โดยบริการนี้มีมาก่อนหน้านี้แล้ว แต่ในงานครั้งนี้ทาง aCommerce เปิดฟีเจอร์ AskIQ ที่เปิดให้ผู้ใช้ถามข้อมูลได้โดยตรง โดยระบบสามารถออกรายงานจากข้อมูลที่มีทันที

สิงคโปร์เปิดตัว Project Moonshot ชุดเครื่องมือทดสอบความปลอดภัยและรับมือความเสี่ยงด้าน AI

By: Chomsu

on 4 June 2024 - 16:11 Tags:

Topics:

Singapore

Artificial Intelligence

LLM

คุณโจเซฟีน เตียว (Josephine Teo) รัฐมนตรีกระทรวงการสื่อสารและสารสนเทศแห่งสิงคโปร์ เปิดตัว AI Verify - Project Moonshot เวอร์ชันเบต้าเป็นชุดเครื่องมือทดสอบปัญญาประดิษฐ์ ออกแบบมาประเมินความปลอดภัยที่เกี่ยวข้องกับการใช้โมเดลภาษาขนาดใหญ่ (LLM) ซึ่งเป็น Open-source เจ้าแรกๆ ที่สามารถจำลองการโจมตี (red-teaming) การเปรียบเทียบมาตรฐาน และการทดสอบพื้นฐานมารวมกันในแพลตฟอร์มเพื่อรับมือกับความเสี่ยงด้าน AI

OpenAI เตรียมเปิดตัวหนังสั้น 5 เรื่อง ที่สร้างด้วย Sora ในงานเทศกาลภาพยนตร์ Tribeca Festival

By: arjin

on 1 June 2024 - 16:16 Tags:

Topics:

OpenAI

Movies

Video

Artificial Intelligence

LLM

เทศกาลภาพยนตร์ Tribeca Festival ซึ่งกำหนดจัดขึ้นวันที่ 5-16 มิถุนายนนี้ ที่เมืองนิวยอร์ก ประกาศเซสชันเปิดตัวภาพยนตร์สั้น 5 เรื่อง ที่ผลิตด้วย Sora โมเดล AI สร้างวิดีโอสั้นคุณภาพสูงจาก Text Prompt ของ OpenAI ซึ่งจะเป็นครั้งแรกที่มีการเปิดตัวภาพยนตร์จาก Sora นี้

Jane Rosenthal หนึ่งในผู้จัดงาน Tribeca Festival บอกว่ารากฐานของงาน Tribeca คือการพูดถึงวิธีการเล่าเรื่องที่เปลี่ยนแปลงสิ่งต่าง ๆ ในโลก ซึ่งสามารถผลิตได้บนฟอร์แมตหลากหลายเช่น ภาพยนตร์ขนาดยาว, การสร้างประสบการณ์แนว Immersive, งานศิลปะ ซึ่งหนังสั้นที่สร้างด้วย AI ก็เช่นเดียวกัน

Anthropic เปิดตัวเครื่องมือสร้างแชทบอตคัสตอมบน Claude AI

By: arjin

on 1 June 2024 - 08:32 Tags:

Topics:

Claude

Anthropic

LLM

Chatbot

Developer

Anthropic บริษัทปัญญาประดิษฐ์ผู้พัฒนาโมเดล Claude ประกาศเพิ่มฟีเจอร์ใหม่สำหรับแชทบอตเรียกว่า Tool useให้ผู้ใช้งานสามารถเชื่อมต่อโปรแกรมต่าง ๆ กับ Claude API ได้ หรือนำไปทำแชทบอตแบบคัสตอมนั่นเอง

จุดเด่นของ Claude API คือรองรับอินพุทที่เป็นรูปภาพได้ด้วย จึงสามารถนำไปพัฒนาเครื่องมือวิเคราะห์ข้อมูลจากภาพ ตัวอย่างที่ Anthropic นำเสนอเช่นเป็นแชทบอตแนะนำไอเดียการตกแต่งภายในห้อง โดยถ่ายรูปส่งไปเป็นต้น

ชุด Tool use นี้ สามารถใช้งานได้แล้วตั้งแต่วันนี้ผ่าน Anthropic Messages API, Amazon Bedrock และ Vertex AI บน Google Cloud

ที่มา: Anthropic

[ลือ] Siri ใน iOS 18 จะรองรับคำสั่งของ App ที่มากขึ้น, สั่งให้ทำงานหลายอย่างต่อเนื่องได้

By: arjin

on 31 May 2024 - 17:20 Tags:

Topics:

Siri

iOS 18

Rumors

Apple

Artificial Intelligence

LLM

Mark Gurman แห่ง Bloomberg คนเดิม รายงานข้อมูลล่าสุดที่เขาทราบมาเกี่ยวกับความสามารถใหม่ของ Siri ในระบบปฏิบัติการ iOS 18 ที่แอปเปิลจะเปิดตัวในงาน WWDC เดือนหน้า ซึ่ง มีข่าว ออกมา เรื่อย ๆ ก่อนหน้านี้ว่า Siri จะมีความสามารถที่มากขึ้น รวมทั้งความสามารถด้าน Generative AI

Gurman บอกว่า Siri ตัวใหม่ใน iOS 18 จะมีความสามารถควบคุมจัดการฟังก์ชันต่าง ๆ ในแอปได้มากขึ้น ตัวอย่าง เรียกเปิดเอกสารเฉพาะ, ย้ายบันทึกไปไว้อีกโฟลเดอร์, ส่งเมล, ลบเมล, อีเมลแบบแนบลิงก์, ให้สรุปเนื้อหาเว็บ

Mistral เปิดตัว Codestral โมเดล Generative AI ขนาด 22B สำหรับงานเขียนโค้ด รองรับกว่า 80 ภาษา

By: arjin

on 30 May 2024 - 18:32 Tags:

Topics:

Mistral

LLM

Programming

Developer

Mistral บริษัทปัญญาประดิษฐ์จากฝรั่งเศสที่ มีไมโครซอฟท์ถือหุ้นอยู่ด้วย เปิดตัวโมเดล Generative AI ขนาด 22B สำหรับการเขียนโค้ดตัวแรกของบริษัท มีชื่อว่า Codestral

Codestral ถูกเทรนด้วยโค้ดมากกว่า 80 ภาษา ซึ่งรวมทั้งภาษาเขียนโปรแกรมยอดนิยมอย่าง Python, Java, C, C++, JavaScript, และ Bash ไปจนถึงภาษาอย่าง Swift และ Fortran จึงรองรับการทำงานของนักพัฒนาในหลายรูปแบบสถานการณ์ มีความสามารถทั้ง ช่วยเขียนโค้ด เขียนเทสต์ หรือช่วยเติมส่วนที่ขาดหายในโค้ดได้ จึงช่วยลดเวลาและเพิ่มประสิทธิภาพให้กับนักพัฒนาได้

สงคราม AI จีนหั่นราคาสู้กันเอง Alibaba ลดราคาโมเดล 97%, ByteDance ลด 99%, Baidu แจกฟรี

By: mk

on 24 May 2024 - 19:31 Tags:

Topics:

China

LLM

Artificial Intelligence

Alibaba Cloud

Baidu

ByteDance

Bloomberg รายงานสงคราม AI ฝั่งจีนที่กำลังร้อนแรงในช่วงสัปดาห์ที่ผ่านมา หลังค่าย Alibaba เปิดสงครามราคา หั่นค่าใช้บริการ AI ของตัวเองที่ชื่อ Qwen (ชื่อเต็มคือ Tongyi Qianwen) ลงมากถึง 97% บีบให้คู่แข่งต้องเล่นสงครามราคาตาม

หลังจากนั้นไม่กี่ชั่วโมง ค่าย Baidu ประกาศว่าบริการ Ernie AI บางโมเดลย่อยเปลี่ยนมาให้บริการฟรี และฝั่งค่าย ByteDance ก็ต้องลดราคาโมเดล Doubao 99% ตามมาด้วยเช่นกัน

เมื่อต้นเดือนนี้ Alibaba เพิ่งออก Qwen เวอร์ชัน 2.5 ที่มีความสามารถมากขึ้น อย่างไรก็ตาม การใช้งานโมเดล AI จากฝั่งจีนยังจำกัดเฉพาะบริษัทจีนซะมาก ตัวอย่างลูกค้าที่ Alibaba นำมาโชว์ยังมีเฉพาะบริษัทจีนด้วยกันเอง เช่น Xiaomi และ Perfect World Games

รัฐบาลจีนกำลังพัฒนา LLM และแชตบอทที่อิงจากปรัชญา วิธีคิดของ Xi Jinping

By: nismod

on 24 May 2024 - 14:40 Tags:

Topics:

China

LLM

Artificial Intelligence

หน่วยงานวิจัย Cyberspace Research Institute ของจีน เปิดเผยว่ากำลังพัฒนาโมเดล LLM และตัว AI แบบตอบโต้ โดยอิงจากปัญหาและวิธีคิดของผู้นำ Xi Jinping

โมเดลถูกเทรนด้วยเอกสารของรัฐบาลและหนังสือ "Xi Jinping Thought on Socialism with Chinese Characteristics for a New Era ( 习近平新时代中国特色社会主义思想学习问答 ) ซึ่งเป็นหนังสือปรัชญาการเมืองและอุดมการณ์ของเลขาธิการพรรคคอมมิวนิสต์ โดยตอนนี้ ตัวปัญญาประดิษฐ์หรือแชทบอตยังไม่มีการให้บริการ แต่เปิดทดสอบภายในอยู่

พบฟีเจอร์ AI Overviews ของ Google ให้คำตอบแปลกหลายครั้ง เช่น ให้ผสมกาวเพื่อให้ชีสติดกับแป้งพิซซ่า

By: arjin

on 24 May 2024 - 13:34 Tags:

Topics:

Google Search

Google

Artificial Intelligence

LLM

กูเกิลทดสอบฟีเจอร์ใช้ Generative AI ช่วยตอบคำถามของผู้ใช้งานผ่านหน้าผลการค้นหามา ตั้งแต่ปีที่แล้ว ซึ่งปัจจุบันเรียกชื่อฟีเจอร์นี้ว่า AI Overviewsและมีแผนขยายบริการนี้ ไปยังผู้ใช้งานทุกคน โดยเริ่มที่สหรัฐอเมริกาในสัปดาห์ที่ผ่านมา จึงทำให้มีรายงานการตอบคำถามของกูเกิลที่ดูไม่ค่อยดีเท่าใดนักออกมา

ผู้ใช้งานคนหนึ่งแชร์คำตอบของคำถามว่า ทำพิซซ่าอย่างไรให้ชีสไม่ไหลหลุดจากแป้ง ซึ่ง AI Overviews ตอบว่าให้ผสมกาวไป 1/8 ถ้วย จะช่วยได้ คำตอบนี้ย่อมไม่ถูกต้องและทำจริงไม่ได้ ที่น่าสนใจคือใน Reddit มีคนค้นพบว่า เคย มีคนตอบแบบนี้เมื่อ 11 ปีที่แล้ว ซึ่งน่าจะเป็นแหล่งข้อมูลที่กูเกิลนำมาใช้ตอบนั่นเอง

Khan Academy เปิดระบบ AI ผู้ช่วยสอนให้ครูสหรัฐใช้งานฟรี ใช้โมเดลขนาดเล็ก Phi 3 ทำให้ต้นทุนต่ำลง

By: mk

on 23 May 2024 - 10:05 Tags:

Topics:

Khan Academy

Microsoft

LLM

Artificial Intelligence

Education

Khan Academy เว็บไซต์คอร์สออนไลน์ชื่อดัง ประกาศความร่วมมือกับไมโครซอฟท์ เปิดบริการผู้ช่วย AI สำหรับช่วยสอนวิชาการให้นักเรียน ชื่อว่า Khanmigo และเปิดให้บริการฟรี

รูปแบบการทำงานของ Khanmigo ไม่ต่างอะไรจากแชทบอท AI อื่นๆ มากนัก แต่ปรับความเชี่ยวชาญของบอทให้เป็นเหมือนติวเตอร์สอนวิชา มีความรู้ความเชี่ยวชาญในสาขาวิชานั้นๆ เหมือนกับครูคนหนึ่ง เหมือนเป็นผู้ช่วยสอน (TA) ประจำตัวของนักเรียนแต่ละคน สามารถตอบคำถาม ช่วยแนะนำวิธีการทำโจทย์ได้ (ดูคลิปประกอบ)

ไมโครซอฟท์เปิดตัว Phi Silica โมเดลหลักของ Copilot+ PC ทุกเครื่อง, รุ่นเล็กสุดของ Phi-3

By: mk

on 22 May 2024 - 17:06 Tags:

Topics:

Microsoft

Artificial Intelligence

LLM

NPU

ไมโครซอฟท์เปิดเผยรายละเอียดเบื้องหลัง Copilot+ PC ที่เป็นการนำพีซีพลัง NPU มารันโมเดลปัญญาประดิษฐ์แบบ on-device ภายในเครื่อง ตกลงแล้วโมเดลตัวที่ว่านี้ชื่อว่า Phi Silica (อ่านว่า "ไฟ ซิลิกา") ถือเป็นหนึ่งในเวอร์ชันย่อยของ ชุดโมเดล Phi 3 โดยปรับแต่งมาเพื่อการรันบน NPU โดยเฉพาะ

Phi Silica พัฒนาต่อมาจาก Phi-3-mini โมเดลรุ่นเล็กสุดของซีรีส์ Phi-3 แล้วปรับขนาดให้เล็กลงอีกหน่อย (ขนาดพารามิเตอร์ลดลงจาก 3.8B เหลือ 3.3B) เพื่อให้รันใน NPU ได้พอดี ศักยภาพของ Phi Silica รองรับอินพุต 650 token ต่อวินาที ใช้พลังงานเพียง 1.5 วัตต์เท่านั้น

ไมโครซอฟท์เปิดตัวโมเดล Phi-3 ครบทั้งชุด เพิ่มโมเดลภาพ Vision มาเป็นครั้งแรก

By: mk

on 22 May 2024 - 10:02 Tags:

Topics:

Microsoft

LLM

Artificial Intelligence

ในงาน Build 2024 เมื่อคืนนี้ ไมโครซอฟท์เปิดตัวโมเดลขนาดเล็ก Phi 3 ครบชุด หลังจาก เปิดตัว Phi-3-mini มาตั้งแต่เดือนเมษายน

โมเดลในชุด Phi 3 มีด้วยกันทั้งหมด 4 ตัว เป็นโมเดลภาษา (small language model หรือ SML) จำนวน 3 ขนาด พ่วงด้วยของใหม่คือโมเดลภาพ (multimodal) ตัวแรกของไมโครซอฟท์ที่เปิดซอร์สออกมาคือ Phi-3-vision

IBM ขยายบริการ Watsonx ช่วยเขียนโค้ดภาษา Java เพิ่ม, เปิดให้รันโมเดลจากบริษัทอื่น

By: mk

on 22 May 2024 - 07:41 Tags:

Topics:

Watson

IBM

Java

Programming

LLM

Artificial Intelligence

IBM ประกาศขยาย บริการปัญญาประดิษฐ์ Watsonx ที่เปิดตัวในปี 2023 จากเดิมมีเฉพาะ Watsonx Code Assistant for Z ตัวช่วยแปลงโค้ดภาษา COBOL บนเมนเฟรม และ Red Hat Ansible Lightspeed มาสู่บริการข้างเคียงอื่นๆ

IBM โอเพนซอร์สโมเดลช่วยเขียนโค้ด Granite ที่อยู่เบื้องหลัง Watsonx Code Assistant

By: mk

on 22 May 2024 - 06:41 Tags:

Topics:

IBM

Watson

LLM

Open Source

IBM ประกาศโอเพนซอร์สโมเดลช่วยเขียนโค้ดของตัวเองชื่อ Granite โดยบอกว่ามีประสิทธิภาพเหนือกว่าโมเดลโอเพนซอร์สคู่แข่งในขนาดใกล้เคียงกัน (7B-8B) เช่น Google Gemma หรือ Meta CodeLlama

Granite เป็นโมเดลที่อยู่เบื้องหลัง บริการ Watsonx Code Assistant (WCA) ที่เปิดตัวเมื่อปีที่แล้ว และนำไปใช้งานกับโค้ด COBOL ในเมนเฟรม Z หรือ Ansible Lightspeed ของฝั่ง Red Hat

Scarlett Johansson เผย OpenAI เคยติดต่อขอใช้เสียงใน ChatGPT แต่ปฏิเสธไป จึงตกใจที่เสียง Sky เหมือนกับตน

By: arjin

on 21 May 2024 - 13:36 Tags:

Topics:

OpenAI

ChatGPT

Scarlett Johansson

Sam Altman

LLM

ประเด็นที่ OpenAI ประกาศ หยุดให้บริการเสียงพูด Sky ใน ChatGPT ชั่วคราว เนื่องจากถูกตั้งข้อสงสัยว่าเสียงเหมือนกับนักแสดง Scarlett Johansson แม้ทาง OpenAI ยืนยันว่าใช้เสียงนักพากย์มืออาชีพ ที่อาจจะออกมาเหมือน แต่ยืนยันว่าไม่ได้ตั้งใจเลียนแบบ ดูเหมือนจะมีอะไรที่ซับซ้อนมากกว่านั้น

ChatGPT จะปิดตัวเลือกเสียงพูด "Sky" ชั่วคราว หลังถูกตั้งข้อสังเกตว่าเสียงคล้าย Scarlett Johansson

By: arjin

on 20 May 2024 - 18:14 Tags:

Topics:

ChatGPT

OpenAI

LLM

OpenAI มีฟังก์ชัน Voice Mode ใน ChatGPT ให้ใช้งาน ตั้งแต่กันยายน ปีที่แล้ว ซึ่ง ChatGPT สามารถโต้ตอบเป็นเสียงพูดได้ โดยระบุว่าเสียงที่ออกมานั้นใช้นักพากย์มืออาชีพ

อย่างไรก็ตามในตัวเลือก 5 เสียงที่มีให้ใช้งานได้แก่ Breeze, Cove, Ember, Juniper และ Sky ตัวเลือกเสียงอันหลังสุด Sky กลายเป็นประเด็นเมื่อมีคนตั้งข้อสงสัยว่าน้ำเสียงนั้นคล้ายกับนักแสดง Scarlett Johansson (Natasha Romanoff ใน Black Widow)

OpenAI ยืนยันว่าเสียงของ Sky เป็นของนักพากย์มืออาชีพหญิงคนหนึ่ง ที่พูดแบบธรรมชาติ และไม่ใช่ Scarlett Johansson แต่จะไม่เปิดเผยตัวตนเพื่อความเป็นส่วนตัว โดย OpenAI จะเริ่มปิดการใช้งานเสียง Sky ชั่วคราวเพื่อตรวจสอบเรื่องนี้เพิ่มเติม

กูเกิลเผยรายละเอียดการรัน Gemini Nano ในแอนดรอยด์, เตรียมเปิดให้แอพอื่นใช้งาน, ใช้โมเดลอื่นได้ด้วย

By: mk

on 20 May 2024 - 11:32 Tags:

Topics:

Gemini

Android

LLM

Google

Artificial Intelligence

ในงาน Google I/O 2024 ของใหม่อย่างหนึ่งที่เรียกเสียงฮือฮาในงานคือการโชว์โมเดล Gemini Nano รันในมือถือแอนดรอยด์โดยตรง ทำงานออฟไลน์ แล้วสามารถตรวจสอบการสนทนาที่เป็น scam หลอกหลวงได้ เป็นการโชว์ประโยชน์ของการรันโมเดลในมือถือให้เห็นชัดๆ ว่าทำอะไรได้บ้าง

หลังจากนั้นกูเกิลยังได้ออกวิดีโอเซสชัน Android on-device AI under the hood มาอธิบายรายละเอียดของการรันโมเดลในมือถือแอนดรอยด์เพิ่มเติม มีรายละเอียดดังนี้

ChatGPT รองรับการเพิ่มไฟล์โดยตรงจาก Google Drive และ OneDrive เฉพาะลูกค้าเสียเงิน

By: arjin

on 17 May 2024 - 11:51 Tags:

Topics:

ChatGPT

LLM

Artificial Intelligence

OpenAI

Google Drive

OneDrive

OpenAI ประกาศเพิ่มปรับปรุงเครื่องมือวิเคราะห์ข้อมูลใน ChatGPT โดยรองรับการเพิ่มไฟล์โดยตรงจาก Google Drive และ Microsoft OneDrive แล้ว (ได้ทั้งคู่นะ ไม่เหมือนแอปเดสก์ท็อป )

ฟังก์ชันเพิ่มไฟล์โดยตรงจาก Google Drive หรือ Microsoft OneDrive รองรับไฟล์ในหลายฟอร์แมตทั้งเอกสาร, สเปรดซีต หรือสไลด์นำเสนอข้อมูล สามารถขยายพื้นที่ของไฟล์ในหน้า ChatGPT เพื่อดูข้อมูลประกอบได้ รองรับข้อมูลที่ถูกปรับปรุงเรียลไทม์ในระหว่างการสนทนาวิเคราะห์ข้อมูล

กูเกิลทดลอง Gemini Nano บน Chrome ข้อมูลไม่หลุดจากเครื่อง รองรับโมเดล fine-tune

By: lew

on 16 May 2024 - 10:36 Tags:

Topics:

Chrome

LLM

Gemini

กูเกิลเปิดโครงการทดลอง Built-in AI เตรียมนำ Gemini Nano มารันใน Chrome โดยตรง เปิดทางให้เบราว์เซอร์มี API ในกลุ่ม LLM เพิ่มเติม

ฟีเจอร์ที่เว็บไซต์จะสามารถใช้งาน LLM บนเว็บได้ เช่น การช่วยสรุป หรือถามตอบคำถามในเนื้อหาบนเว็บเอง ไปจนถึงการเป็นตัวช่วยผู้ใช้เขียนเนื้อหา หรือตรวจคำผิด

ทุกวันนี้เว็บไซต์หลายแห่งรันโมเดลปัญญาประดิษฐ์บนเว็บอยู่แล้ว แต่การใช้งานแบบทุกวันนี้ทำให้ผู้ใช้ต้องดาวน์โหลดไฟล์ขนาดนับร้อยเมกะไบต์ทุกเว็บ และอาจใช้งานฟีเจอร์ต่างๆ ของเครื่องเช่น GPU หรือ NPU ได้จำกัด การที่เบราว์เซอร์มี API โดยตรงให้เลยจะทำให้ออปติไมซ์ได้ดีขึ้น

กูเกิลโชว์ Gemini Nano รุ่นใหม่ เข้าใจภาพและเสียง เตือนได้ทันทีเมื่อถูกโจรโทรมาหลอกเงิน

By: lew

on 15 May 2024 - 01:44 Tags:

Topics:

Android

Gemini

LLM

Scam

กูเกิลโชว์ Gemini Nano โมเดลปัญญาประดิษฐ์สำหรับโทรศัพท์รุ่นใหม่รองรับอินพุตหลายรูปแบบทั้งภาพ, เสียง, และข้อความ พร้อมกับความสามารถของแอป Gemini ที่ผูกเข้ากับระบบของแอนดรอยด์เต็มตัว

Gemini Nano อ่านภาพได้ ทำให้สามารถบรรยายภาพได้โดยไม่ต้องมีข้อมูลล่วงหน้า กูเกิลใส่ความสามารถนี้ในฟีเจอร์ TalkBack ที่ช่วยผู้มองเห็นได้จำกัด ทำให้สามารถบรรยายภาพได้อย่างละเอียด นอกจากนี้ยังสามารถฟังเสียงได้ ทำให้สามารถฟังเสียงการสนทนาตลอดเวลาและแจ้งเตือนทันทีเมื่อพบว่าบทสนนนาน่าจะเป็นการหลอกลวง ฟีเจอร์นี้จะเป็นแบบ opt-in ต้องเปิดใช้งานเอง และจะเปิดให้ใช้ภายในปีนี้ (ไม่ระบุประเทศที่รองรับ)

แอป Gemini เพิ่มฟีเจอร์ Live คุยเป็นเสียง พูดแทรกได้, สร้างแชตเฉพาะทางแบบเดียวกับ GPT

By: lew

on 15 May 2024 - 01:07 Tags:

Topics:

Gemini

Google

LLM

กูเกิลอัพเดต Gemini Advanced เวอร์ชั่นผู้ใช้ทั่วไป เป็น Gemini 1.5 Pro ทำให้รองรับ context window ขนาด 1 ล้านโทเค็นแบบเดียวกับการใช้งานแบบเดียวกับการใช้งานผ่าน API รองรับการอัพโหลดข้อมูลขนาดใหญ่เข้าไปยังแชตได้โดยตรง โดยมีฟีเจอร์ใหม่หลักๆ ได้แก่

กูเกิลอัพเดต Gemini 1.5 ฟังเสียงได้แล้ว เพิ่มรุ่น Flash ราคาประหยัด, ความเร็วสูง

By: lew

on 15 May 2024 - 01:04 Tags:

Topics:

Gemini

Google

LLM

กูเกิลอัพเดตโมเดล Gemini 1.5 Pro โดยขยาย context window เป็น 2 ล้านโทเค็น ทำให้สามารถรองรับข้อมูลขนาดใหญ่มาก และเชื่อฟังคำสั่งมากขึ้น โดยเฉพาะคำสั่งฟอร์แมต์เอาท์พุต หรือพฤติกรรมของ AI และการวางแผนการทำงานได้ดีขึ้นทำให้สามารถเรียกฟังก์ชั่นภายนอกได้มากขึ้น

นอกจากนี้กูเกิลยังเปิดตัว Gemini 1.5 Flash ที่ราคาประหยัดลงแต่ประสิทธิภาพยังใกล้เคียง Gemini 1.5 Pro โดยอาศัยเทคนิค distillation ที่ดึงความสามารถจากโมเดลขนาดใหญ่ และรองรับ context window ขนาด 1 ล้านโทเค็นเท่ากับรุ่นใหญ่ ราคาค่าใช้งาน 0.35 ดอลลาร์ต่อล้านโทเค็น

Gemini 1.5 Pro และ 1.5 Flash เปิดให้ใช้งานได้ทั้งทาง Google AI Studio และ Vertex AI ส่วนเวอร์ชั่น 2 ล้านโทเค็นยังทดสอบวงปิดต้องขอใช้งาน

ผลทดสอบ Tokenizer ของ GPT-4o ภาษาไทยประหยัดเท่าตัว

By: lew

on 14 May 2024 - 10:22 Tags:

Topics:

OpenAI

ChatGPT

LLM

เมื่อคืนที่ผ่านมา OpenAI เปิดตัว GPT-4o พร้อมกับประกาศเปลี่ยน tokenizer ใหม่โดยอาศัย 20 ภาษาต้นแบบในการบีบอัดข้อมูล ทำให้ภาษาต่างๆ ประหยัดโทเค็นยิ่งขึ้น แม้ภาษาไทยจะไม่อยู่ในรายชื่อ 20 ภาษา แต่ผลการทดลองก็พบว่าภาษาไทยนั้นประหยัดโทเค็นลงเท่าตัว

tokenizer ของ GPT-4o สามารถจับคำหรือส่วนของคำในภาษาไทยได้ชัดเจน คำสามัญเช่น "ของ" หรือ "จำนวน" ก็สามารถมองเป็นโทเค็นเดียวได้ทันที เทียบกับ tokenizer ของ GPT-4 ที่ไม่สามารถรวบตัวอักษรหลายตัวในภาษาไทยเข้าด้วยกันได้เลย ทำให้จำนวนโทเค็นกับจำนวนตัวอักษรใกล้เคียงกัน

Alibaba Cloud เปิดตัวปัญญาประดิษฐ์ Qwen2 ใช้งานได้เสรี พร้อมรองรับภาษาไทย

กูเกิลเปิดบริการ NotebookLM แอปทำสรุปโน้ตพลัง Gemini นอกสหรัฐฯ คนไทยได้ใช้ด้วย

aCommerce อาศัย Generative AI บน AWS เปิดให้ลูกค้าถามข้อมูลธุรกิจด้วยตัวเอง

สิงคโปร์เปิดตัว Project Moonshot ชุดเครื่องมือทดสอบความปลอดภัยและรับมือความเสี่ยงด้าน AI

OpenAI เตรียมเปิดตัวหนังสั้น 5 เรื่อง ที่สร้างด้วย Sora ในงานเทศกาลภาพยนตร์ Tribeca Festival

Anthropic เปิดตัวเครื่องมือสร้างแชทบอตคัสตอมบน Claude AI

[ลือ] Siri ใน iOS 18 จะรองรับคำสั่งของ App ที่มากขึ้น, สั่งให้ทำงานหลายอย่างต่อเนื่องได้

Mistral เปิดตัว Codestral โมเดล Generative AI ขนาด 22B สำหรับงานเขียนโค้ด รองรับกว่า 80 ภาษา

สงคราม AI จีนหั่นราคาสู้กันเอง Alibaba ลดราคาโมเดล 97%, ByteDance ลด 99%, Baidu แจกฟรี

รัฐบาลจีนกำลังพัฒนา LLM และแชตบอทที่อิงจากปรัชญา วิธีคิดของ Xi Jinping

พบฟีเจอร์ AI Overviews ของ Google ให้คำตอบแปลกหลายครั้ง เช่น ให้ผสมกาวเพื่อให้ชีสติดกับแป้งพิซซ่า

Khan Academy เปิดระบบ AI ผู้ช่วยสอนให้ครูสหรัฐใช้งานฟรี ใช้โมเดลขนาดเล็ก Phi 3 ทำให้ต้นทุนต่ำลง

ไมโครซอฟท์เปิดตัว Phi Silica โมเดลหลักของ Copilot+ PC ทุกเครื่อง, รุ่นเล็กสุดของ Phi-3

ไมโครซอฟท์เปิดตัวโมเดล Phi-3 ครบทั้งชุด เพิ่มโมเดลภาพ Vision มาเป็นครั้งแรก

IBM ขยายบริการ Watsonx ช่วยเขียนโค้ดภาษา Java เพิ่ม, เปิดให้รันโมเดลจากบริษัทอื่น

IBM โอเพนซอร์สโมเดลช่วยเขียนโค้ด Granite ที่อยู่เบื้องหลัง Watsonx Code Assistant

Scarlett Johansson เผย OpenAI เคยติดต่อขอใช้เสียงใน ChatGPT แต่ปฏิเสธไป จึงตกใจที่เสียง Sky เหมือนกับตน

ChatGPT จะปิดตัวเลือกเสียงพูด "Sky" ชั่วคราว หลังถูกตั้งข้อสังเกตว่าเสียงคล้าย Scarlett Johansson

กูเกิลเผยรายละเอียดการรัน Gemini Nano ในแอนดรอยด์, เตรียมเปิดให้แอพอื่นใช้งาน, ใช้โมเดลอื่นได้ด้วย

ChatGPT รองรับการเพิ่มไฟล์โดยตรงจาก Google Drive และ OneDrive เฉพาะลูกค้าเสียเงิน

กูเกิลทดลอง Gemini Nano บน Chrome ข้อมูลไม่หลุดจากเครื่อง รองรับโมเดล fine-tune

กูเกิลโชว์ Gemini Nano รุ่นใหม่ เข้าใจภาพและเสียง เตือนได้ทันทีเมื่อถูกโจรโทรมาหลอกเงิน

แอป Gemini เพิ่มฟีเจอร์ Live คุยเป็นเสียง พูดแทรกได้, สร้างแชตเฉพาะทางแบบเดียวกับ GPT

กูเกิลอัพเดต Gemini 1.5 ฟังเสียงได้แล้ว เพิ่มรุ่น Flash ราคาประหยัด, ความเร็วสูง

ผลทดสอบ Tokenizer ของ GPT-4o ภาษาไทยประหยัดเท่าตัว

Pages

About Blognone

Spread Blognone

Other Version

Copyright Notice

You are here

Pages

sign in

About Blognone

Spread Blognone

Other Version

Copyright Notice