چگونه مدل های بزرگ نوآوری تکنولوژیکی را در رانندگی خودمختار هدایت می کنند - اخبار نمایشگاه

سیستم های تصمیم گیری رانندگی خودمختار سنتی اغلب به طراحی مدولار متکی هستند. از درک محیط زیست ، برنامه ریزی تصمیم گیری تا کنترل وسایل نقلیه ، هر زیر سیستم به طور مستقل کار می کند و به طور مشترک عملکرد وسیله نقلیه را کنترل می کند. در سناریوهای ترافیک پیچیده ، این معماری سلسله مراتبی مستعد مشکلاتی از قبیل خطاهای تجمعی ، از دست دادن اطلاعات و عملکرد کافی در زمان واقعی است. مدل های بزرگ به تدریج با پارامترهای گسترده خود ، قابلیت های پردازش داده های متقابل و پارادایم های یادگیری پایان به پایان ، این وضعیت را به تدریج تغییر می دهند. این نه تنها می تواند به ترکیب کارآمد داده های چند حسگر در سطح ادراک برسد ، بلکه از طریق درک عمیق و استدلال منطقی در سطح تصمیم گیری ، استراتژی های رانندگی معقول تری را برای وسایل نقلیه نیز برنامه ریزی می کند و از این طریق ایمنی و استحکام کلی را تقویت می کند.

مزایای مدل های بزرگ در رانندگی خودمختار

فرایند توسعه فناوری رانندگی خودمختار به خودی خود مراحل مختلفی را پشت سر گذاشته است ، از رانندگی اولیه کمک شده تا انتقال تدریجی به رانندگی کاملاً خودمختار. سیستم های اولیه بیشتر به تشخیص ساده شیء و کنترل قانون متکی بودند. با توسعه یادگیری عمیق ، اتخاذ روش هایی مانند CNN ، RNN و حتی GAN به طور مداوم ادراک و توانایی های تصمیم گیری را بهبود بخشیده است. علاوه بر این ، فناوری ترکیب BEV (نمای چشم پرنده) و ترانسفورماتور تا حدی برای کمبود روشهای سنتی در مدل سازی فضایی و زمانی ساخته شده است. می توان گفت که معرفی مدل های بزرگ اساساً در حال تغییر شکل معماری کلی سیستم های رانندگی خودمختار است و پایه و اساس محکمی برای تجاری سازی سطح L3 ، L4 و حتی L5 در آینده ایجاد می کند.

معماری مدل مبتنی بر ترانسفورماتور معمولاً مکانیسم خودآگاهی را اتخاذ می کند ، که می تواند وابستگی های مسافت طولانی را به خود جلب کند ، در نتیجه باعث بهبود چشمگیر جهانی و صحت پردازش اطلاعات می شود. از طریق رویکرد تنظیم قبل از ترحم ، این مدل بر روی داده های بدون برچسب در مقیاس بزرگ از قبل آموزش داده می شود و سپس برای کارهای رانندگی خودمختار خاص تنظیم می شود. این نه تنها اعتماد به مقدار زیادی از داده های دارای برچسب را کاهش می دهد بلکه این مدل را قادر می سازد تا از قابلیت مهاجرت متقابل برخوردار باشد. مدلهای بزرگ چند حالته می توانند به طور همزمان فرم های مختلف داده مانند تصاویر ، ابرهای نقطه ای و داده های رادار را پردازش کنند ، از "دیدن" تا "درک" و وقف سیستم های رانندگی خودمختار با قابلیت های شناختی شبیه به انسان استفاده کنند.

کاربرد خاص مدل های بزرگ در رانندگی خودمختار

در سیستم های رانندگی خودمختار ، استفاده از مدل های بزرگ عمدتاً در جنبه های مختلفی مانند ادراک محیطی ، تصمیم گیری و برنامه ریزی و کنترل وسیله نقلیه منعکس می شود. از نظر ادراک محیطی ، سیستم های سنتی عمدتاً به داده های یک سنسور واحد برای تشخیص هدف و تقسیم معنایی متکی هستند. با این حال ، به دلیل محدودیت های روشنایی ، آب و هوا و سنسورها ، آنها اغلب در مقابله با سناریوهای پیچیده مشکل دارند. از طریق فناوری فیوژن داده های چند حالته ، مدل های بزرگ می توانند داده های مختلفی مانند دوربین ، لیدرها ، رادارهای موج میلی متر و نقشه های با دقت بالا را ادغام کنند تا نمایشی غنی تر و دقیق تر از محیط ایجاد کنند. به عنوان مثال ، مدل عملکرد بصری-زبان (VLA) می تواند به طور همزمان اطلاعات بصری و اطلاعات معنایی را در تصویر استخراج کند و دقت بسیار بالایی را در تشخیص موانع ، پیش بینی رفتارهای عابر پیاده و داوری شرایط جاده نشان می دهد. پس از آنکه اطلاعات چند سنسورهای متعدد توسط مدل بزرگ به شدت ذوب می شود ، نه تنها استحکام تشخیص هدف افزایش می یابد ، بلکه پیش بینی صحنه های پویا را می توان از طریق تجزیه و تحلیل سری زمانی حاصل کرد ، و ورودی قابل اطمینان تری برای تصمیم گیری وسیله نقلیه فراهم می کند.

در سطح تصمیم گیری و برنامه ریزی ، سیستم های سنتی رانندگی خودمختار معمولاً به قوانین از پیش تعیین شده یا الگوریتم های برنامه ریزی مبتنی بر مدل متکی هستند تا نتایج ادراک را به برنامه ریزی مسیر و تصمیمات عمل تبدیل کنند. با این حال ، این روش در هنگام مواجهه با شرایط پیچیده ترافیکی که قبلاً هرگز دیده نشده بود ، مستعد عدم موفقیت است و طراحی رابط بین هر ماژول نسبتاً سفت و سخت است و دستیابی به بهینه سازی پایان به پایان را دشوار می کند. از طریق یک چارچوب یادگیری پایان به پایان ، مدل های بزرگ می توانند مستقیماً اطلاعات کلیدی را از داده های سنسور خام استخراج کرده و دستورات کنترل وسیله نقلیه را از طریق استدلال منطقی ذاتی تولید کنند. DriveGPT {7}} و LanguageMPC پتانسیل استفاده از مدل های بزرگ را برای تصمیم گیری چند کاره نشان داده اند. مدل های آنها نه تنها می توانند استراتژی های رانندگی معقول را در سناریوهای پیچیده ایجاد کنند بلکه توضیحات مفصلی را نیز ارائه می دهند و باعث افزایش تفسیر سیستم می شوند. مزیت این تصمیم گیری پایان به پایان در کاهش خطاهای میانی در فرآیند انتقال اطلاعات و این امکان را برای کل سیستم فراهم می کند که توانایی سازگاری با سناریوهای جدید را داشته باشد.

کنترل وسیله نقلیه ، به عنوان مرحله آخر رانندگی خودمختار ، نه تنها به صحت تصمیم گیری بلکه به ضمانت پاسخ در زمان واقعی سیستم نیز نیاز دارد. از آنجا که مدل های بزرگ معمولاً پارامترهای بی شماری و هزینه های محاسباتی زیادی دارند ، در استقرار مستقیم آنها در سیستم های نصب شده وسیله نقلیه چالش های خاصی وجود دارد. این صنعت اکتشافات گسترده ای را در فشرده سازی مدل و سبک وزن انجام داده است. از طریق فناوری تقطیر مدل ، دانش اساسی در مدل های بزرگ استخراج می شود و سپس به مدل های کوچک و کارآمد منتقل می شود تا به یک مسابقه کامل با سخت افزار درون وسیله نقلیه (مانند سری NVIDIA Drive AGX) برسد. این فناوری نه تنها عملکرد بالای مدلهای بزرگ را حفظ می کند بلکه تضمین می کند که زمان پاسخگویی نیازهای کنترل زمان واقعی را برآورده می کند ، بنابراین نقش مهمی در فرآیند تجاری سازی رانندگی خودمختار L3\/L4 ایفا می کند.

در شبیه سازی و تأیید حلقه بسته رانندگی خودمختار ، مدلهای بزرگ نیز مزایای قابل توجهی را نشان داده اند. آموزش با داده های در مقیاس بزرگ و صحنه های مصنوعی می تواند مدل های واقعی جهان را بسازد و آزمایش حلقه بسته را می توان در یک محیط مجازی از طریق فناوری دوقلوی دیجیتال انجام داد. این روش نه تنها خطرات و هزینه های انجام تعداد زیادی از آزمایشات را در جاده های واقعی به میزان قابل توجهی کاهش می دهد ، بلکه می تواند به سرعت سناریوهای مختلف با دم شدید و طولانی را شبیه سازی کند و پشتیبانی داده های کافی را برای بهینه سازی تکراری مدل فراهم می کند. مدل Emma Waymo ، با استفاده از سیستم عامل های شبیه سازی و فناوری مدل بزرگ ، به پیش بینی مسیر با دقت بالا و تصمیم گیری جلوگیری از برخورد دست یافته است. عملکرد آن بسیار فراتر از سیستم های سلسله مراتبی سنتی است و رویکرد جدیدی را برای تأیید حلقه بسته سیستم های رانندگی کاملاً مستقل در آینده فراهم می کند.

علاوه بر این ، مدل های بزرگ نیز نقش مهمی در تقویت امنیت سیستم و تجربه کاربر داشته اند. رانندگی خودمختار صرفاً یک مسئله فنی نیست. این همچنین شامل تعامل انسان و رایانه و مسائل اعتماد اجتماعی است. از طریق فناوری پردازش زبان طبیعی ، مدل های بزرگ می توانند به مکالمات در زمان واقعی با رانندگان ، پیشنهادات رانندگی و هشدارهای اضطراری ارائه دهند و حتی بر اساس احساسات راننده کمک های شخصی ارائه دهند. چنین طراحی تعامل می تواند اعتماد مسافران را به میزان قابل توجهی افزایش دهد و باعث می شود سیستم رانندگی خودمختار نه تنها در فناوری پیشرفته تر شود بلکه بیشتر مطابق با نیازهای کاربر در برنامه های عملی باشد.

مدل های بزرگ در رانندگی خودمختار چه چالش هایی ایجاد می کنند؟

اگرچه مدلهای بزرگ پتانسیل بسیار خوبی را در زمینه رانندگی خودمختار نشان داده اند ، اما هنوز هم مشکلات زیادی در تبدیل آنها از دستاوردهای آزمایشگاهی به برنامه های تجاری وجود دارد. عملکرد و منابع محاسباتی در زمان واقعی یکی از تنگناهای اصلی در حال حاضر است. مدلهای بزرگ معمولاً در مقیاس بزرگی از پارامترها و پیچیدگی محاسباتی بالایی دارند. برای ایجاد تصمیمات در سطح میلی ثانیه ، نیازهای بسیار بالایی را برای قدرت محاسبات پلت فرم محاسبات درون وسیله نقلیه ایجاد می کند. تراشه های اختصاصی هوش مصنوعی می توانند مورد استفاده قرار گیرند ، و مدل های بزرگی را می توان از طریق تکنیک هایی مانند تقطیر مدل و کمیت فشرده سازی کرد و در تلاش برای پاسخگویی به نیازهای پاسخ در زمان واقعی ضمن اطمینان از عملکرد.

مسائل مربوط به امنیت و استحکام نیز چالش های اساسی در استفاده از مدلهای بزرگ است. هنگامی که یک وسیله نقلیه خودمختار یک اشتباه تصمیم گیری را انجام دهد ، عواقب آن می تواند بسیار جدی باشد. بنابراین ، مدل های بزرگ قبل از استفاده عملی باید تحت آزمایش و تأیید دقیق قرار بگیرند تا اطمینان حاصل کنند که می توانند در سناریوهای مختلف پیچیده و شدید به درستی پاسخ دهند. با توجه به ماهیت "جعبه سیاه" مدل های بزرگ ، توضیحات داخلی آنها اغلب توضیح آنها دشوار است. چگونگی تقویت تفسیر مدل در حالی که اطمینان از عملکرد بالا به یک مشکل فوری برای حل مقامات نظارتی و خودروسازان تبدیل شده است. در آینده ، با ترکیب روش هایی مانند یادگیری تقویت ، تنظیم دقیق بر اساس بازخورد انسان و محدودیت های قانون ، انتظار می رود سیستم های تصمیم گیری را طراحی کند که هم کارآمد و هم شفاف باشد.

حریم خصوصی داده ها و مسائل اخلاقی نیز در استفاده از مدل های بزرگ قابل نادیده گرفتن نیست. سیستم های رانندگی خودمختار نیاز به جمع آوری مقدار زیادی از داده های وسیله نقلیه ، محیط زیست و کاربر و ذخیره ایمن و استفاده از این داده ها به طور مستقیم با حفاظت از حریم شخصی کاربر مرتبط هستند. نحوه بهره برداری کامل از مزایای داده های بزرگ در حالی که تضمین امنیت انتقال و پردازش داده ها اولین موضوعی است که مقامات نظارتی باید به آن بپردازند. لازم است استانداردهای سختگیرانه محافظت از داده ها و مکانیسم های حفاظت از حریم خصوصی برای ارائه ضمانت های نهادی برای استفاده ایمن از مدل های بزرگ در رانندگی خودمختار تهیه شود.

همکاری بین نرم افزار و سخت افزار نیز کلید اجرای مدل های بزرگ است. کاربرد موفقیت آمیز مدل های بزرگ نه تنها به نوآوری الگوریتم بستگی دارد ، بلکه به پشتیبانی سخت افزار با کارایی بالا نیز نیاز دارد. در حال حاضر ، تولید کنندگان عمده به طور متوالی سیستم عامل های محاسباتی درون خودرو نسل جدید مانند Nvidia Drive Agx Pegasus ، Atlan و غیره را راه اندازی کرده اند. این سیستم عامل ها تضمین های سخت افزاری را برای استنباط در زمان واقعی و استقرار در مقیاس بزرگ مدل های بزرگ ارائه می دهند. پیشرفت مداوم فناوری سنسور همچنین منابع داده فراوانی و با کیفیت تر را برای همجوشی داده های چند حالته فراهم کرده است. با بهبود مداوم کل اکوسیستم رانندگی خودمختار ، ادغام عمیق نرم افزار و سخت افزار موظف است کل صنعت را به یک دوره کاملاً جدید از سفرهای هوشمند سوق دهد.

تأثیر عمیق مدلهای بزرگ بر فناوری رانندگی خودمختار نه تنها در جزئیات فنی منعکس می شود ، بلکه باعث تغییر پارادایم از سیستم های مدولار سنتی به پایان دادن به انتهای و هوش ادراکی به هوش شناختی شده است. سیستم رانندگی خودمختار آینده ، به رهبری مدل های بزرگ ، به درک محیطی با دقت بالاتر ، تصمیم گیری و برنامه ریزی انعطاف پذیر تر و همچنین کنترل خودرو ایمن تر و کارآمدتر دست می یابد. در عین حال ، در تعامل انسان ، کمک های شخصی و امنیت داده ها به سطح جدیدی خواهد رسید.