کیا گوگل کا "ناممکن" نیالل نیٹ ورک واقعی کسی بھی تصویر کے مقام کو بتا سکتا ہے؟

$config[ads_kvadrat] not found

دس فنی لمØات جس ميں لوگوں Ú©ÛŒ کيسے دوڑيں لگتی ہيں ™,999 فنی

دس فنی لمØات جس ميں لوگوں Ú©ÛŒ کيسے دوڑيں لگتی ہيں ™,999 فنی
Anonim

تصاویر تلاش کرنے سے کہیں زیادہ آسان ہے. لیکن اگر آپ کسی جگہ پر کسی چیز کی تصویر ڈھونڈنے کی کوشش کررہے ہیں جو مکمل طور پر واضح نہیں ہے (اس طرح مصری پیرامیڈ یا پیرس میں وشال انگوٹھا مجسمہ)، یہ آپ کے مقابلے میں مشکل ہے - یہاں تک کہ جغرافیائی معلومات کے بارے میں کیا ہے تصویر میں

ٹوبیا وےینڈ نامی ایک گوگل انجنیئر درج کریں اور اس کے ساتھیوں کے ایک جوڑے. جرنل میں ایک نیا کاغذ کے مطابق arxiv (واضح "آرکائیو")، ٹریو نے اس کی مکمل طور پر اس کے پکسلز کے تجزیہ پر تقریبا کسی بھی تصویر کے مقام پر توجہ مرکوز کرنے میں ایک گہری سیکھنے والا مشین بنایا ہے.

اس طرح کے کام کو کامیابی سے کامیاب کرنے کے لئے ایک مشین حاصل کرنے کے لئے، آپ بصری اشارے پر مبنی انٹیوٹی معلومات کی صلاحیت دینا چاہتے ہیں. آپ یہ چاہتے ہیں کہ دوسرے الفاظ میں، انسان کی طرح سوچیں.

وےند نے ایک مصنوعی نیورل نیٹ ورک کو تیار کرنے کے بارے میں مقرر کیا - دماغ کے نیورولوجی راستے کو موڑنے کے لئے ڈیزائن کرنے والی ایک مشین کا نظام، جو اس کو انسان کی طرح معلومات، سیکھنے اور معلومات کو یاد کرنے کی اجازت دیتا ہے. یہ نیا نظام، پلیٹائن، تصاویر کی جگہوں کو تعین کرنے کی بجائے انسانوں کو خارج کرنے کی صلاحیت رکھتا ہے، اس سے کوئی فرق نہیں پڑتا ہے کہ یہ انڈور یا آؤٹ ڈور ہے، اور کسی بھی قسم کے منفرد یا نونڈیسسپل بصری اشارہ کی خاصیت.

PlaNet پہلو کس طرح کرتا ہے؟ وےند اور ان کی ٹیم نے دنیا کے نقشے کو ایک گرڈ میں تقسیم کیا جس نے مختلف علاقوں پر 26000 مربع کی شکلیں قائم کی ہیں، ان مقامات پر انحصار کیا جاسکتا ہے. گھنے جگہیں جہاں چھوٹے سائز میں بہت سارے تصاویر فٹ ہوتے ہیں، جبکہ بڑے، زیادہ دور دراز علاقوں بڑے چوکوں میں کاٹ سکتے ہیں.

اس ٹیم نے پہلے سے ہی جغرافیائی تصاویر کی ایک بڑی ڈیٹا بیس بنائی ہے - تقریبا 126 ملین مختلف تصاویر. PlaNet کو سکھانے کے لئے ڈیٹا بیس کے طور پر 91 ملین کے بارے میں استعمال کیا گیا تھا کہ یہ کیسے پتہ چلتا ہے کہ دنیا کی نقشے پر کون سا تصویر بنایا جا سکتا ہے.

اس کے بعد، نیورل نیٹ ورک کو ڈیٹا بیس سے دوسرے 34 ملین تصاویر کو جغرافیائی کرنے کا فرض کیا گیا تھا. آخر میں، پلیٹائن فلکر سے 2.3 ملین جیوٹیکیٹ تصاویر کی ڈیٹا سیٹ پر قائم کیا گیا تھا.

نتائج؟ PlaNet 28.4 فیصد تصاویر اور براعظم 48 فیصد کے لئے اصل ملک کا تعین کر سکتا ہے. اس کے علاوہ، نظام نے سڑک کی سطح کا محل وقوع 3.6 فیصد فلکر تصاویر، اور شہر کی سطح 10.1 فی صد کے لئے مقام کا نشانہ بنایا.

اور PlaNet زیادہ انسانوں کے مقابلے میں بہتر ہے - یہاں تک کہ سب سے بڑا گلوبلٹرٹر. وےند نے 10 وے سفر کرنے والے افراد کو گوگل اسٹریٹ دیکھیں پر پایا تصاویر کے مقامات پر لیبل کے کھیل میں پلیٹ نیٹ کے خلاف مقابلہ کرنے کا اعلان کیا.

"مجموعی طور پر، PlaNet نے 1131.7 کلو میٹر کے میڈین لوکلائزیشن کی غلطی کے ساتھ 50 راؤنڈوں میں سے 28 جیت لیا، جبکہ میڈل انسانی لوکلائزیشن کی غلطی 2320.75 کیلومیٹر تھی،" محققین نے لکھا. "یہ چھوٹے پیمانے پر تجربے سے پتہ چلتا ہے کہ پلینیٹ اسٹریٹ منظر کے مناظر کو جغرافیائی کارروائی کے کام میں زبردست کارکردگی تک پہنچتا ہے."

کیا یہ حقیقی کے لئے ہے؟ کیا ایک انجنیئر نے واقعی "زبردست" تیار کیا. ای. نظام؟

جب یہ جغرافیائی تصاویر کی صورت میں آتا ہے، شاید. اور یہ سب حیران کن نہیں ہے - ای. انسانی دماغ کو ہر طرح سے بنیادی طور پر قابو پانے کی ضرورت نہیں ہے، لیکن زیادہ مشکل کاموں کو پورا کرنے کے چند مخصوص طریقوں میں انسانی حدود کو بڑھانے کے لئے. لہذا اس معنی میں، جو محققین لکھنے میں سچ ہے.

پھر بھی، یہ پلاٹا نیٹ "نیورل نیٹ ورک" کال کرنے کے لئے ایک وسیع ہے. اس نوعیت کی ٹیکنالوجی کا ایک مثالی شکل تصویر جغرافیائی محل وقوع کے مقابلے میں زیادہ سے زیادہ کے بارے میں سیکھنے کے قابل ہو جائے گا. A.I. سسٹم سمائلی اور کھیل لکھنے کے قابل ہیں سپر ماریو لیکن یہ ایک مثالی "ماسٹر" نظام کے مقابلے میں چھوٹی چیزیں ہے جو خود کار طریقے سے وٹیلوں کی نگرانی اور برقرار رکھتی ہے، نقل و حرکت یا توانائی کی بنیادی ڈھانچے کو منظم کرسکتا ہے، اور بہت کچھ.

$config[ads_kvadrat] not found