گوگل قابلیت کنترل کامپیوتر را به هوش مصنوعی جمینای ۳.۵ فلش اضافه کرد تا توسعهدهندگان ایجنتهای هوش مصنوعی برای مدیریت دسکتاپ بسازند. گوگل با ادغام مستقیم قابلیت کنترل کامپیوتر در هوش مصنوعی جمینای ۳.۵ فلش، به توسعهدهندگان اجازه میدهد تا ایجنتهای هوش مصنوعی برای ناوبری در مرورگرها، رابطهای کاربری موبایل و برنامههای دسکتاپ بسازند. این ویژگی که اکنون در مرحله پیشنمایش قرار دارد، تحولی بزرگ در اتوماسیون کارهای خستهکننده اداری ایجاد میکند. گوگل میگوید قابلیت Computer use جمینای ۳.۵ فلش به یک ایجنت هوش مصنوعی امکان میدهد تا اسکرینشاتها را بررسی کند و اقداماتی مانند کلیک ماوس، اسکرول صفحه و تایپ با کیبورد را شبیه به یک انسان انجام دهد. به گفته گوگل، کاربران میتوانند از این ویژگی برای کارهایی مانند پرکردن خودکار فرمهای طولانی، آزمایش نرمافزارها، تحقیق در چندین وبسایت و اجرای جریانهای کاری سازمانی استفاده کنند. پیشازاین، گوگل قابلیت کنترل کامپیوتر را در یک مدل مجزای جمینای ۲.۵ ارائه میکرد، اما اکنون مهندسان این شرکت آن را درون مدل پایدار جمینای ۳.۵ فلش ادغام کردهاند تا نیازی به استفاده از مدلهای تخصصی نباشد. کنترل کامپیوتر هوش مصنوعی جمینای ۳.۵ فلش سپردن کنترل ماوس و کیبورد به هوش مصنوعی نگرانیهای امنیتی زیادی نیز دارد، اما گوگل برای رفع این مشکل از آموزشهای تقابلی هدفمند استفاده کرده است تا مدل خود را در برابر حملات تزریق پرامپت محافظت کند. این شرکت دو سیستم ایمنی سازمانی قدرتمند را نیز راهاندازی کرده است؛ سیستم اول پیش از انجام هرگونه تغییر حساس یا غیرقابل بازگشت، تأییدیه انسان را درخواست میکند. سیستم دوم نیز به محض تشخیص یک حمله احتمالی، وظایف درحال اجرا را فوراً متوقف میکند. مدل پیشرفته جمینای ۳.۵ فلش که گوگل آن را در ماه مه معرفی کرد، با پشتیبانی از یک میلیون توکن ورودی و ۶۵ هزار توکن خروجی، به رقابت با سایر غولهای فناوری میپردازد. اگرچه گوگل اولین شرکتی نیست که قابلیت کنترل کامپیوتر را ارائه میدهد و رقبایی مانند آنتروپیک با هوش مصنوعی Claude و شرکت OpenAI قبلاً در این مسیر گام برداشتهاند، اما جمینای با ارائه سطوح تفکر قابل تنظیم به توسعهدهندگان اجازه میدهد تا استدلال بیشتر را با تأخیر و هزینه کمتر مبادله کنند.