اگر به یاد داشته باشید مدتی پیش بود که گوگل استارتاپ DeepMind را خریداری کرد. خرید این شرکت و نمونه های مشابه آن علاقهی خاص گوگل به هوش مصنوعی را نشان میدهند. این توجه خاص به شرکتهای هوش مصنوعی میتواند خبرهای خوبی را در آینده رقم بزند. اما هدف گوگل از این کار چیست؟ آیا میخواهد موتور جست و جوی خود را ارتقا دهد یا به فکر راه اندازی یک سرویس جدید است.
استارتاپ DeepMind در سال ۲۰۱۲ و توسط دمیس هاسابیس، دانشمند عصب شناسی و نابغهی شطرنج، و دو همکار او کلید خورده است. در صفحهی اصلی وبسایت نوشته شده است که:
ما بهترین تکنیک های یادگیری ماشین را با علم عصب شناسی ترکیب کردیم تا بهترین الگوریتم های یادگیری را ایجاد کنیم.
یادگیری عمیق چیست؟
یادگیری عمیق موضوع جدیدی است که به عنوان زیرمجموعه ای از هوش مصنوعی مطرح میشود. این فرآیند زیرمجموعه ای از یادگیری ماشین است که از شبکه های عصبی برای بهبود رفتارهایی از ماشین مانند تشخیص گفتار، بینایی کامپیوتر و پردازش زبان طبیعی استفاده میکند. این موضوع با اینکه قدمت کمی دارد ولی توانسته به یکی از هیجان انگیز ترین بخش های تکنولوژی حاضر تبدیل شود.
یوشو بنگو (Yoshua Bengio)، استاد تمام گروه علوم کامپیوتر دانشگاه مونترآل که یکی از بهترین ها در زمینهی هوش مصنوعی است، میگوید:
یادگیری عمیق در حال حاضر بسیار ارزشمند است. زیرا افراد متخصص زیادی در این زمینه وجود ندارند. از آنجایی که ۵ سال برای تربیت یک دانشجوی دکتری زمان لازم است و ۵ سال پیش عدهی محدودی در این زمینه فعالیت میکردند، در حال حاضر افرد متخصص زیادی در زمینهی یادگیری عمیق وجود ندارد. با این حال این افراد برای ما بسیار با ارزش هستند.
برای اینکه مفهوم یادگیری عمیق را متوجه شوید، اول از همه باید آن را از سایر مفاهیم هوش مصنوعی جدا کنید. در واقع مانند یاد گرفتن زبان فرانسوی میماند. اگر میخواهید تمامی لغات را به خاطر بسپارید، باید مطالبی را که یاد گرفتهاید به طور سلسه وار تکرار کنید تا به حافظهی بلند مدت شما منتقل شوند. با این روش تقریبا تمامی مطالبی که یاد میگیرید در حافظهی شما میماند بدون اینکه چیزی را حفظ کرده باشید.
با این اوصاف یادگیری عمیق به دانشی گفته میشود که باید به کامپیوتر بدهیم تا بتواند بر اساس یک سری قوانین با محیط اطراف خود تعامل داشته باشد. در این فرآیند یک اپراتور انسانی صدها مثال آموزشی را به کامپیوتر میدهد و اشتباهات آن را به صورت دستی اصلاح میکند.
دکتر جورج ای دال، سرپرست تیمی که در دانشگاه تورنتو روی پروژه های هوش مصنوعی کار میکند، میگوید:
بیشتر برنامه های کاربردی در یادگیری ماشین مبتنی بر مهندسی دستی میباشد که در آن متخصص باید اطلاعات مربوطه را کدگزاری کرده و به ماشین بدهد. این رویه تفاوتی کوچکی با یادگیری عمیق دارد. در یادگیری عمیق پژوهشگر بررسی را به خود سیستم واگذار میکند.
در واقع بر خلاف یادگیری ماشین، یادگیری عمیق عمدتا بدون نظارت است. در یادگیری عمیق هدف ایجاد شبکه های بزرگ عصبی است که میتوانند یاد بگیرند و بدون دخالت انسان در مورد مسائل فکر کنند.
بنگو معتقد است یادگیری عمیق باعث میشود تا کامپیوتر مفاهیم را به صورت انتزاعی بیاموزد. مبنای یادگیری عمیق بر این است که کامپیوتر همانند انسان درک متفاوتی از مفاهیم خواهد داشت. این یعنی مثال های ساده برای درک سطوح پایین تر و مفاهیم انتزاعی که باید از همین مثال های کوچک دریافت شوند. برای رسیدن به چنین حالتی سیستم باید قدرت تعمیم دادن داشته باشد.
همه میخواهند روی مفهوم یادگیری عمیق کار کنند
در سال ۲۰۱۱ اندرو نگ، استاد دانشگاه استنفورد، پروژهی مغز گوگل را راه اندازی کرد. در این پروژه بیش از ده میلیارد ویدئوی یوتیوب به شانزده هزار پردازنده ای که با شبکه به هم متصل شده بودند داده شد تا رایانه بتواند تصویر یک گربه را از میان تصاویر دیگر تشخیص دهد.
سال گذشته نیز فیسبوک ین لکون (Yann LeCun) را به عنوان مدیر جدید بخش هوش مصنوعی خود معرفی کرد تا از تخصص او برای تشخیص بهتر چهره ها و اشیا در 350 میلیون عکس و ویدئویی که روزانه در این شبکهی اجتماعی آپلود میشود، کمک بگیرد.
شاید سیستم تشخیص صدای سیری و گوگل ناو ملموس ترین مثالی باشد که میتوان برای یادگیری عمیق زد. این فناوری بیشتر از همه مدیون مقالهی شبکه های عصبی عمیق وابسته به متن در تشخیص واژگان گفتار میباشد که در سال ۲۰۱۲ توسط دال نوشته شده است.
دال میگوید بیشتر پروژه های تشخیص گفتار که هم اکنون توسط شرکت های فناوری اجرا میشوند از تکنیک شبکه های عصبی عمیقی که او بیان کرده است، استفاده میکنند.
جالب اینجاست که یادگیری عمیق در مقایسه با شبکه های کم عمق و مدل مخلوط گوسی (GMMs)، پیشرفت بیشتری را در سیستم های تشخیص گفتار به وجود آورده است. به گفته محققان گوگل در نسخهی جدید اندروید که در آن یادگیری عمیق به روش های تشخیص گفتار افزوده شده است، نرخ خطای صدا 25 درصد کمتر از نسخه های قبلی آن است.
" یادگیری عمیق چیزی است که کمپانی های بزرگی چون فیسبوک و گوگل به آن علاقمندند. درک معنای چیزی که کاربران مینویسند یا میگویند، برای بهبود رابط کاربری و تبلیغ بسیار مهم است. یادگیری عمیق به میزان زیادی درصد خطا را در تشخیص گفتار و نوشتار کم میکند و از این لحاظ بسیار ارزشمند است."
اخلاق در یادگیری عمیق
گوگل برای اینکه بتواند deep mind را بخرد ملزم به ایجاد یک برد اخلاقی برای هوش مصنوعی بود. به نقل از افراد آگاه به مسئله، عاملی که باعث شد گوگل دست فیسبوک را از deep mind کوتاه کند این بود که قبول کرد یک برد اخلاقی در زمینهی هوش مصنوعی ایجاد کند. برخلاف فیلم های علمی تخیلی که امروزه در زمینهی هوش مصنوعی ساخته میشود، در دنیای واقعی قوانین محکمی برای رعایت اخلاق وجود دارد. این قوانین جدای از الزام رعایت حریم خصوصی، روی اینکه هوش مصنوعی نباید به کسی صدمه بزند تاکید میکند.
تصمیم گیری اخلاقی چه از لحاظ محاسباتی و چه ریاضی چالش بزرگی است که در یادگیری بدون نظارت مطرح میشود. اینکه ماشین ها بتوانند در جامعهی انسانی وظیفهی خود را به درستی انجام دهند و قابلیتهایی مانند احساسات، شعور اجتماعی، همدلی و وجدان را اجرا کند.
دال میگوید:
ما هنوز درک محدودی از طرز کار مغز انسان و برخی از تصمیم گیری های خاص آن داریم.
یادگیری عمیق هنوز در مراحل اولیه خود است
تازه بودن مفهوم یادگیری عمیق ویژگی است که آن را جذاب تر میکند. شاید هوش مصنوعی به شکلی نباشد که در فیلم ها عادت به دیدن آن داریم ولی به این معنی هم نیست که نمیتوان هوش مصنوعی را در تمامی مفاهیم دنیای اطراف پیاده سازی کرد.
به هر حال دانش کامپیوتر بسیار جوان است و مفهوم یادگیری عمیق هم جوانتر از آن. هنوز راه زیادی مانده تا بتوانیم از این تکنیک در تمام ابعاد زندگی استفاده کنیم اما روشن است که این فناوری در آینده ای نزدیک کاربردهایی فراتر از تشخیص تصویر و گفتار خواهد داشت. به هر حال یادگیری عمیق در حال حاضر تعیینکننده مسیر آینده هوش مصنوعی است.