همه چیز در مورد تکنولوژی جدید و دقیقی که در قطر برای آفسایدگیری استفاده شد!

دسامبر 19, 2022

تکنولوژی آفسایدگیری قطر

در این مطلب به بررسی تکنولوژی جدید استفاده شده در جام جهانی قطر برای کاهش احتمال اشتباهات داوری می‌پردازیم.

اگر هر یک از مسابقات جام جهانی را از تلویزیون تماشا کرده باشید، با فناوری جدیدی که توسط VAR (کمک داور ویدیویی) برای کمک به تعیین زمان آفساید بودن یک بازیکن استفاده می‌شود، آشنا شده‌اید.

اگرچه معمولاً در هر مسابقه اثر آن فقط برای چند ثانیه روی صفحه تلویزیون ظاهر می‌شود، مسلماً یکی از مهم‌ترین بخش‌های مسابقات جام جهانی قطر 2022 است.

توسعه فناوری نیمه خودکار آفساید (SAOT) دهه‎‌ها طول کشیده است. این فناوری به سیستم‌های هوش مصنوعی (AI) پیچیده، باتری دوربین‌های خاص و همچنین توپی مملو از حسگرها نیاز دارد؛ که چنین امکاناتی حدود 10 سال پیش غیرممکن به نظر می‌رسید.

فناوری بینایی کامپیوتری که بر آن تکیه دارد، نسل جدیدی از خدمات جمع‌آوری داده‌ها را تقویت می‌کند، که در حال تغییر نحوه مربی‌گری و «بازی جهانی» و سایر ورزش‌ها هستند.

ردیابی اندام‌های هر بازیکن

برای یادآوری باید بگوییم که نحوه نمایش SAOT در تلویزیون به این صورت است: وقتی یک آفساید احتمالی تشخیص داده می‌شود، بازی متوقف می‌شود و نمای واقعی ناگهان به نمایش مجازی مسابقه تغییر می‌کند و بازیکنان به‌عنوان چهره‌های مانکن مانند در جای خود و با پیراهن خود ظاهر می‌شوند. به طوری که تصویر آنها در لحظه مشکوک به آفساید متوقف شده است.

همچنین صفحه‌ای با رنگ سفید شفاف که در عرض زمین حرکت می‌کند موقعیت دقیق خط آفساید را نشان می‌دهد.

اگر یک اینچ از بدن یک مهاجم (به غیر از دست و بازو) فراتر از این خط باشد، آفساید در نظر گرفته می‌شود. (با توجه به تصمیم داور)

این فرایند ممکن است ساده به نظر برسد، اما وقتی به این فکر می‌کنید که چه چیزی لازم است تا این سیستم به اندازه کافی امکان پذیر و قابل اعتماد باشد، تا در جام جهانی از آن استفاده شود، سوالات گوناگونی ایجاد می‌شوند.

مثلاً چگونه SAOT مکان نه تنها هر بازیکن در زمین، بلکه موقعیت اندام آنها را تا حد میلی‌متر تشخیص می‌دهد؟

داستان چگونگی توسعه این فناوری با مجموعه‌ای متنوع از داستان‌های دیگر تلاقی می‌کند، از رویدادهای واقعی در پشت فیلم Moneyball، حذف انگلستان از جام جهانی 2010، تا منشا فیلترهای بسیار محبوب اسنپ چت!

داستان از تابستان 1966 آغاز می‌شود.

پروژه‌ای تابستانی که چندین دهه به طول انجامید!

بینایی کامپیوتری، یا آموزش کامپیوتر برای تشخیص بصری اشیا، چیزی است که ممکن است آسان به نظر برسد، اما واقعا سخت و پیچیده است.

به عنوان مثال، وظیفه شناسایی یک پرنده را در نظر بگیرید. می‌توان به رایانه یک عکس داد و آموزش داد که الگوی خاصی از پیکسل‌ها به جسمی به نام «پرنده» را تشکیل می‌دهند. اما پرنده‌ها به اطراف می‌چرخند. می‌پرند و حرکت می‌کنند. الگوی پیکسل‌ها با هر عکس تغییر می‌کند.

برای آموزش تشخیص پرنده به رایانه، باید به آن یاد دهید که آن پیکسل‌ها را تفسیر کند. شما باید به نوعی به آن یاد دهید که “پرنده” رایج را در میلیون‌ها عکس تشخیص دهد.

به دلایلی، در ابتدا تصور می‌شد که این کار آسان است.

در سال 1966، ماروین مینسکی، دانشمند کامپیوتر MIT، به یک دانشجوی سال اول کارشناسی را مأمور کرد تا این مشکل را در تابستان حل کند.

سیمون لوسی، مدیر موسسه استرالیایی یادگیری ماشین در دانشگاه آدلاید، می‌گوید، نیازی به گفتن نیست که دانشجو آن مسئله را حل نکرد، اگرچه کار آنها پایه‌گذارهای اصلی این رشته بود.

او می‌گوید: «بسیاری از مردم فکر می‌کردند که واداشتن ماشین‌ها به اینکه انسان‌ها و اشیا را به گونه‌ای که ما انسان‌ها آنها را می‌بینیم، ببینند، واقعاً ساده است.

اما معلوم شد که این کار بسیار دشوار است.»

هرچند دهه‌های بعدی شاهد پیشرفت‌های آهسته‌ای بودیم. به‌عنوان مثال می‌توان به ربات‌ها یاد داد که جعبه‌ها را در خطوط مونتاژ تشخیص دهند یا کدهای پستی دست‌نویس روی پاکت‌ها را بخوانند، اما این کارها هم به پایان رسید.

سپس، در سال 2012، یک پیشرفت ناگهانی رخ داد.

ظهور Cat filterها

پروفسور لوسی می‌گوید: “2012 یک نقطه عطف بزرگ بود. ظهور چیزهایی که شبکه‌های عصبی عمیق نامیده می‌شدند.”

“[آنها] اساساً به بینایی کامپیوتری اجازه دادند تا از این نوع کنجکاوی تئوریک که دولت‌ها بر اساس آن بودجه‌های مالی دریافت می‌کردند… عبور کند. قدرت به شرکت‌هایی داده شد که واقعاً متوجه شده بودند که می‌توان از آنها چه استفاده‌هایی کرد.

از این نقطه عطف در سال 2012، برنامه‌های بینایی رایانه‌ای که ما هر روز از آنها استفاده می‌کنیم، مانند Face ID آیفون و جستجوی عکس معکوس Google، و همچنین سیستم‌های دیگری که توسط انسان‌ها استفاده می‌شوند، از نظارت تشخیص چهره گرفته تا ماشین‌های پلیسی که پلاک‌ها را اسکن می‌کنند، روزبه‌روز بیشتر شدند.

اما نکته اول: شبکه عصبی عمیق (DNN) چیست؟ شبکه‌های عصبی برای تقلید از نحوه تفکر و یادگیری انسان طراحی شده‌اند. آنها از لایه‌هایی از گره‌ها تشکیل شده‌اند، درست مانند مغز انسان که از نورون‌ها تشکیل شده است. گفته می‌شود شبکه بر اساس تعداد لایه‌هایی که دارد عمیق تر است.

فکر می‌کنید می‌توانید محتوای نوشته شده توسط هوش مصنوعی را تشخیص دهید؟

شاید نام GPT-3 را نشنیده باشید، اما به احتمال زیاد با آن سر و کار داشته‌اید، از وبسایتی استفاده کرده‌اید که کد آن را اجرا می‌کند، یا حتی از طریق یک چت بات یا یک شخصیت در یک بازی با آن صحبت کرده‌اید.

کاربرد شبکه‌های عصبی عمیق

برای آموزش تشخیص پرنده در عکس‌ها به رایانه، می‌توان یک DNN را برای انجام این کار با تغذیه مجموعه‌ای از تصاویر حاوی پرندگان و تصاویری که حاوی پرنده نیستند، آموزش داد و هر تصویر را با برچسب «پرنده» یا «غیر پرنده» مشخص کرد.

از طریق تجزیه و تحلیل این تصاویر و جداسازی عناصر تشکیل دهنده شیئی که DNN وظیفه یادگیری آن را بر عهده داشته است (منقار، بال، پر)، دستگاه یاد می‌گیرد که پرندگان را “مشاهده” کند.

این ایده جدید نیست، اما ظهور رایانه‌های قدرتمندتر و در دسترس بودن حجم عظیمی از داده‌ها برای آموزش شبکه‌ها، ایده را به میزان قابل توجهی پخته‌تر و توانمندتر کرده است.

این دقیقا همان چیزی است که در سال 2012 اتفاق افتاد، زمانی که یک DNN به نام AlexNet رقبای خود را در مسابقه سالانه بینایی کامپیوتری ImageNet در هم شکست.

پروفسور لوسی می‌گوید: «معمولاً، وقتی فناوری بهبود می‌یابد، با نوعی خزش مواجه هستیم؛ این فناوری هر سال به آرامی پیش می‌رود.

“سپس، در سال 2012، این پیشرفت عظیم به وجود آمد که چیستی آن برای همه جهان نامشخص بود”.

سه سال بعد، اولین فیلترهای اسنپ چت عرضه شد. با استفاده از رویکرد AlexNet، آنها با نقشه‌برداری از ویژگی‌های صورت کاربر، و سپس اضافه کردن یک پوشش هنری، مانند گوش‌ها و بینی حیوانات، کار می‌کردند.

از مانیبال تا ردیابی خودکار بازیکنان

اما این فناوری فقط برای افزودن سبیل به صورت انسان مفید نبود. در میان کسانی که آن را مورد توجه قرار دادند، شرکت Hawk-Eye هم بود، که در آن زمان بیشتر به خاطر ارائه اشکال شبه خطی در تنیس، یا ترسیم مسیر پیش‌بینی شده توپ در تصمیم‌گیری‌های وجود یا عدم وجود پای بازیکن قبل از خط دروازه در کریکت شهرت داشت.

اگرچه فناوری ردیابی توپ مفید و چشمگیر بود، اما نیازی به دید کامپیوتری پیشرفته نداشت.

پروفسور لوسی می‌گوید: “این فناوری در دهه 90 ساخته شد، زیرا برای اینکه بتوانیم توپ زرد تنیس را ردیابی کنیم، نیازی به هوش مصنوعی پیشرفته نداشتیم.”

اما پیشرفت AlexNet امکانات دیگری را برای کاربرد بینایی کامپیوتری در ورزش باز کرد. پیشرفت‌ها در زمانی رخ داد که فیفا، نهاد حاکم بر فوتبال جهان، به دنبال راه‌هایی بود تا در نهایت خطای انسانی مداوم را از تصمیمات داوری حذف کند.

کاتالیزور تغییر زمانی بود که انگلیس پس از باخت به آلمان از جام جهانی 2010 حذف شده بود؛ مسابقه‌ای که گلی که باید برای انگلیس ثبت می‎شد به طور بحث‌برانگیزی مردود اعلام شد.

فیفا دو سال بعد استفاده از فناوری خط دروازه Hawk-Eye و همچنین شرکت‌های داده‌های ورزشی و تجزیه‌وتحلیل با توجه به پیشرفت‌ها در بینایی کامپیوتری را تایید کرد.

انقلابی در تحلیل داده‌ها، سرآغاز تکنولوژی آفساید

در طول دهه گذشته، ورزش حرفه‌ای دستخوش یک انقلاب آرام در تجزیه و تحلیل داده‌ها شده بود. به طوری که مدیران، استخدام‌کنندگان و مربیان به‌طور فزاینده‌ای تشنه داده‌های بازیکنان و مسابقات بودند که اسرار بازی را رمزگشایی می‌کرد و به تیم آنها برتری می‌داد.

نمونه‌ای که مکرراً ذکر می‌شود، موفقیت Oakland Athletic در فصل بیسبال 2002 (که بعداً در فیلم Moneyball در سال 2011 گفته شد)، پس از استفاده از تجزیه و تحلیل کامپیوتری برای خرید بازیکنان جدید بود.

پاتریک لوسی، دانشمند ارشد در شرکت تجزیه و تحلیل ورزش و داده Stats Perform می‌گوید: «واقعاً، مانیبال سرآغاز تجزیه و تحلیل‌های ورزشی بوده است.”

آنها به جای استفاده از شهود انسانی، از تصمیمات مبتنی بر داده استفاده کردند.

پخش‌کننده‌ها همچنین می‌خواستند داده‌ها پوشش خود را تقویت کنند (مانند «نقشه‌های حرارتی» که حرکت بازیکن را ردیابی می‌کند). در حالی که آژانس‌های شرط‌بندی خواستار تحلیل‌های پیش‌بینی‌کننده مبتنی بر داده بودند.

اما یک مشکل وجود داشت: این داده‌ها باید به صورت دستی جمع‌آوری می‌شد که فوق العاده سخت بود.

دکتر لوسی می‌گوید: «انسان‌ها بازی را تماشا می‌کردند و اساساً اندازه‌گیری‌های فیزیکی را انجام می‌دادند. یعنی فقط می‌دیدند که چقدر دویده‌اند، و سرعت آنها چقدر بوده است».

آنها محل حضور [بازیکن] در هر فریم را ثبت می‌کردند.”

گروه نامشخصی از انسان‌ها هر فریم از صدها بازی را ثبت می‌کردند و جزئیاتی را ضبط می‌کردند، مثلاً زمانی که یک پاس یا شوت اتفاق می‌افتد، یا اینکه چه کسی کجا قدم گذاشته است.

سیستم Opta برای ردیابی بازیکنان

تا سال 2013، سیستم‌های خودکار ایجاد شدند. Stats Perform از بینایی کامپیوتری برای ردیابی توپ‌ها و بازیکنان در هر مسابقه NBA استفاده می‌کرد.

Opta، زیرمجموعه داده‌های ورزشی Stats Perform، اکنون بزرگترین ارائه‌دهنده داده‌های فوتبال در جهان است، از جمله برای فوتبال استرالیا. مطمئناً دیده‌اید که از داده‌های آنها در پوشش بازی‌ها استفاده می‌شود.

دکتر لوسی می‌گوید: «ردیابی بازیکنان [خودکار] بیش از یک دهه است که در فوتبال استفاده می‌شود.

“شما می‌توانید گزینه‌های پاس را در هر فریم اندازه گیری کنید. شما احتمال این را می‌سنجید که “آیا باید به این بازیکن پاس بدهم، آیا باید به آن بازیکن پاس بدهم. احتمال اینکه در 10 ثانیه آینده فرصت ایجاد کنیم چقدر است؟”

“از طریق این ابزار اندازه‌گیری و سپس یادگیری ماشینی، ما می‌توانیم شروع به اندازه گیری چیزهایی کنیم که قبلا نمی‌توانستید اندازه گیری آنها را انجام دهید.”

تکامل و جزییات

تکامل این فناوری، از ردیابی توپ (مثلاً برای تصمیمات LBW)، به ردیابی بازیکنان، و در نهایت، در جام جهانی امسال، به ردیابی اندام بازیکنان رسیده است.

فناوری آفساید نیمه خودکار (SAOT) اولین حضور خود را در جام عرب 2021 انجام داد، اما عمدتاً تا سال 2022 قطر مخفی نگه داشته شده است.

این تکنولوژی تقریباً مانند ردیابی خودکار بازیکنان عمل می‌کند: دوازده دوربین ثابت در موقعیت‌های اطراف استادیوم، 29 نقطه روی بدن هر بازیکن را 50 بار در ثانیه ردیابی می‌کنند!

رابرت آگی، دانشمند علوم ورزشی از دانشگاه ویکتوریا ملبورن می‌گوید: «این موضوع خیلی به دوربین‌ها مربوط نمی‌شود، بلکه بیشتر فناوری پشت آن است.

“این روشی است که تصاویر در آن به مدل‌سازی ردیابی مهره‌ای تبدیل می‌شوند. اعمال و انجام دقیق آن قطعا چالش برانگیز است.”

دانشگاه ویکتوریا یک موسسه تحقیقاتی رسمی فیفا است و پروفسور Aughey دقت SAOT و همچنین سایر سیستم‌های داوری نیمه خودکار را آزمایش کرده است.

او می‌گوید که دوربین‌ها تنها اجزای سیستم نیستند. از آنجایی که آفساید در لحظه ارسال توپ توسط بازیکن مشخص می‌شود، توپ مورد استفاده در مسابقات جام جهانی دارای حسگری با شتاب سنج و ژیروسکوپ برای اندازه‌گیری لحظه دقیق زدن آن است.

او می‌گوید: “اگر به ویدیویی با 50 فریم در ثانیه تکیه می‌کنید، گاهی اوقات می‌توانید نقطه ضربه دقیق را از دست بدهید. ممکن است ضربه دقیقا بین فریم‌ها اتفاق بیفتد.”

این سطح از دقت منجر به قضاوت بازیکنان در آفساید شده، بر اساس فاکتورهایی که در ورزشگاه یا روی صفحه ویدیو قابل مشاهده نیستند.

دقت بالای فناوری

آلن شیرر، مهاجم سابق تیم ملی انگلیس، پس از اینکه گل اکوادور به دلیل آفساید مردود اعلام شد، به بی‌بی‌سی گفت: «تا پایان ماه با بیماری‌های برآمده از فشار خون بالا مواجه خواهم شد.»

فکر نمی‌کنم کسی در دنیا این فیلم را تماشا کند که و فکر کند این ضربه آفساید بوده است!

پاسخ پروفسور آگی به این موضوع این است: به اینکه اشتباه بودن قضاوت‌هایتان ثابت شود عادت کنید!

“این فقط یک مثال از زمانی است که این فناوری می‌تواند دقیق‌تر از آنچه با چشم غیرمسلح دیده می‌شود باشد.

“من فکر می کنم فیفا از [SAOT] بسیار راضی است. اگر لیگ برتر آن را برای فصل آینده معرفی کند، تعجب نمی‌کنم.”

مسیر فوق‌العاده و رو به جلوی فناوری آفساید

پروفسور لوسی از دانشگاه آدلاید می‌گوید “آنچه در مورد SAOT قابل توجه است این نیست که فقط کار می‌کند، بلکه فیفا آنقدر به آن اعتماد دارد که معتقد است همیشه به درستی عمل می‌کند!”

“این سناریوهای پرخطر یک مثال عالی از زمانی است که هوش مصنوعی به طور سنتی با مشکل مواجه شده است.

“میلیاردها نفر در سرتاسر جهان این بازی‌ها را تماشا می‌کنند، و برای درست بودن قضاوت‌ها به شما اعتماد می‌کنند. اگر نادرست باشد، منتقدین زیادی خواهید داشت.”

دکتر لوسی در Stats Perform می‌گوید گام بعدی «تغییر مقیاس‌ها» خواهد بود – راه‌اندازی ردیابی خودکار بازیکنان، و بینش‌های داده‌ای که اجازه استفاده از این سیستم را به لیگ‌های پایین‌تر می‌دهد. از فوتبال باشگاهی نوجوانان گرفته تا بسکتبال کالج.

«اکنون می‌توانید آنچه را که قبلاً نمی‌توانستید، اندازه‌گیری کنید – آنچه فقط بر اساس یک شهود بود.

“داده‌های ورزشی در واقع در مورد بازسازی وقایع و داستان مسابقه است. هر چه داده‌ها دقیق‌تر باشند، داستان بهتری برای تعریف کردن دارید.”

اما همچنان به نیروهای انسانی احتیاج داریم!

برخی ممکن است این ایده را دوست نداشته باشند که اسرار فوتبال یا هر ورزش دیگری را بتوان به ارقام در یک صفحه گسترده تقلیل داد. حتی این تصور که هر کسی با یک تبلت و دسترسی به داده‌های بازیکنان می‌تواند به خوبی یک مربی کارکشته عمل کند، ممکن است توهین‌آمیز باشد!

اما، خوشبختانه، این چیزی نیست که دکتر لوسی به آن معتقد است.

او می‌گوید برخی از معیارها را نمی‌توان اندازه گیری کرد. همه متغیرها قابل محاسبه نیستند.

وقتی می‌توانیم داده‌ها را دیجیتالی کنیم، قطعا عملکرد بهتری خواهیم داشت. اما چیزهایی وجود دارد که نمی‌توانیم آنها را دیجیتالی کنیم.

“ما نمی‌دانیم چه چیزی [به بازیکنان] گفته شده است. ما از احساسات حاکم بر بازی اطلاعی نداریم. مطمئن نیستیم که چه کسی در حال خواندن شبکه‌های اجتماعی است. مطمئن نیستیم که چه کسی با همسرش دعوا کرده است. اطلاع نداریم که فرزند چه کسی بیمار بوده است!”

قبل از جام جهانی، Opta پیش‌بینی کرد که چه کسی قهرمان خواهد شد. و این پیش‌بینی اشتباه بود.

برنده پیش‌بینی شده آنها، برزیل، در مرحله یک چهارم نهایی توسط کرواسی حذف شد.

اوپتا همچنین پیش‌بینی کرد که مراکش در گروه خود رتبه پایینی خواهد داشت، اما در عوض آنها در صدر قرار گرفتند و سپس تیم‌هایی که شانس بالاتری داشتند، مانند اسپانیا و پرتغال را، شکست دادند تا به نیمه نهایی راه پیدا کنند.

دکتر لوسی می‌گوید از آنجایی که بینایی کامپیوتری به قلب ورزش حرفه‌ای نگاه می‌کند، چیزهایی وجود دارد که نمی‌تواند ببیند.

“اندازه گیری احتمالات بسیار سخت است.

“وجود این روش‌های خودکار می‌تواند نشانه‌های بسیار خوبی به ما بدهد، اما قطعی‌ست که انسان باید کنترل را به دست بگیرد.”