آخرین اخبار
facebook Telegram RSS ارسال به دوستان نسخه چاپی
کد خبر : 42341
تاریخ انتشار : 23 دی 1392 9:26
تعداد بازدید : 717

راهکار گوگل برای توسعه سرویس دید خیابانی

اگر شما هم کاربر اینترنت حتی در حد چک کردن ایمیل هم باشید، بارها و بارها با کدهای کپچا مواجه شده اید؛ کدهایی متشکل از حروف بزرگ و کوچک و اعداد که به ویژه برای دسترسی به ایمیل تان معمولا مجبورید که پر کنید. در واقع، این کدها، کدهایی هستند که کاربر انسان را از روبات یا برنامه های هوشمند تمیز خواهند داد. اما به نظر می رسد که گوگل فقط برای کدهای کپچا نیست که از این اعداد و حروف استفاده می کند، بلکه این غول اینترنتی برای شناسایی مطالب درون کتاب های اسکن شده و پلاک خانه ها در سرویس دید خیابانی اش هم از این کدها بهره می برد.

تلگراف- تحقیقات جدید نشان می‌دهد که گوگل در حال ساخت یک شبکه عصبی است که می‌تواند میلیون‌ها پلاک خانه ناشناس را که توسط دوربین‌های دید خیابانی گرفته شده‌، بدون دخالت انسان بخواند. یک شبکه عصبی هوشمند یک مدل رایانشی یا محاسبه‌ای است که از ساختار و عملکرد مغز الهام گرفته است. این سیستم مستقیما روی پیکسل‌ تصاویری کار می‌کند که توسط خودروهای دید خیابانی گوگل گرفته شده‌اند. این مدل بسیار شبیه‌تر از مدل‌های شبیه‌سازی شده‌ای که تاکنون طراحی شده‌اند، همانند مغز شما کار می‌کند. این سیستم به جای اینکه اول تصاویر و اعداد منفرد دریافت کند و بعد یکی یکی آنها را شناسایی کند، تمامی‌اعداد را می‌گیرد و در جا آنها را آنالیز می‌کند؛ دقیقا به همان نحو که مغز ما کار می‌کند.زمانی که شما آدرسی را در گوگل مپز تایپ می‌کنید، انتظار دارید که این سرویس شما را دقیقا به همان آدرسی که مورد نظر شماست، ببرد. البته داشتن آدرس دقیق و درست برای هر ساختار مهم است؛ به ویژه در مناطقی که پلاک خانه‌ها به ترتیب نیستند. این همان چیزی است که نشان می‌دهد چرا گوگل از سیستم مشابه مغز انسان استفاده می‌کند تا پلاک خانه‌ها را به صورت هوشمند ثبت کند تا در نهایت منجر به ارایه‌ آدرس دقیق می‌شود. گوگل برای آموزش این شبکه عصبی، از یک دیتاست (Dataset) مربوط به پلاک خانه‌هایی که در دید خیابانی آماده بوده، استفاده کرده است. این دیتاست شامل 200 هزار آدرس است که پلاک خانه‌ها در آن به شکل 600 هزار تصویر حاوی اعداد نمایش داده شده است.
گوگل از این تصاویر برای آموزش این مغز الکترونیکی استفاده کرده است. به گفته این شرکت، شش روز طول برای این سیستم طول کشیده تا این دیتاست را بیاموزد و بتواند اعداد مربوط به تصاویر دید خیابانی را با دقت بسیاری شناسایی کند. گوگل برای تسهیل خواندن تصاویر توسط این شبکه‌ عصبی، محدودیت‌ها یا به ‌بیان بهتر قوانینی را برای تصاویر نمایش داده شده به این سیستم، در نظر گرفته است. تصاویر مورد نظر باید به صورت خودکار شناسایی شده و بخش مربوط به اعداد به شکلی باشد که یک سوم عرض کل تصویر را از آن خود
کند. همچنین اعداد خوانده شده توسط سیستم باید حداکثر پنج رقم باشد که برای بسیاری از مناطق کاربردی است. صحت خواندن اطلاعات و شماره‌ها از روی تصاویر ذخیره شده توسط نیروی انسانی 98 درصد است که گوگل نیز این مقدار را برای آستانه‌ کارایی شبکه‌ عصبی در نظر گرفته است. این عدد به معنی 98 درصد از کل تصاویر موجود نیست نخواهد بود، بلکه منظور 98 درصد از کل تصاویری است که حائز شرایط خوانده شدن توسط شبکه‌ عصبی باشند. براساس ادعای گوگل، اطلاعات مربوط به 100 میلیون خیابان توسط این سیستم خوانده شده است.


نظر شما



نمایش غیر عمومی
تصویر امنیتی :