اگر هر یک از مسابقات جام جهانی را از تلویزیون تماشا کرده باشید، با فناوری جدیدی که توسط VAR (کمک داور ویدیویی) برای کمک به تعیین زمان آفساید بودن یک بازیکن استفاده میشود، آشنا شدهاید.
اگرچه معمولاً در هر مسابقه اثر آن فقط برای چند ثانیه روی صفحه تلویزیون ظاهر میشود، مسلماً یکی از مهمترین بخشهای مسابقات جام جهانی قطر 2022 است.
توسعه فناوری نیمه خودکار آفساید (SAOT) دههها طول کشیده است. این فناوری به سیستمهای هوش مصنوعی (AI) پیچیده، باتری دوربینهای خاص و همچنین توپی مملو از حسگرها نیاز دارد؛ که چنین امکاناتی حدود 10 سال پیش غیرممکن به نظر میرسید.
فناوری بینایی کامپیوتری که بر آن تکیه دارد، نسل جدیدی از خدمات جمعآوری دادهها را تقویت میکند، که در حال تغییر نحوه مربیگری و «بازی جهانی» و سایر ورزشها هستند.
ردیابی اندامهای هر بازیکن
برای یادآوری باید بگوییم که نحوه نمایش SAOT در تلویزیون به این صورت است: وقتی یک آفساید احتمالی تشخیص داده میشود، بازی متوقف میشود و نمای واقعی ناگهان به نمایش مجازی مسابقه تغییر میکند و بازیکنان بهعنوان چهرههای مانکن مانند در جای خود و با پیراهن خود ظاهر میشوند. به طوری که تصویر آنها در لحظه مشکوک به آفساید متوقف شده است.
همچنین صفحهای با رنگ سفید شفاف که در عرض زمین حرکت میکند موقعیت دقیق خط آفساید را نشان میدهد.
اگر یک اینچ از بدن یک مهاجم (به غیر از دست و بازو) فراتر از این خط باشد، آفساید در نظر گرفته میشود. (با توجه به تصمیم داور)
این فرایند ممکن است ساده به نظر برسد، اما وقتی به این فکر میکنید که چه چیزی لازم است تا این سیستم به اندازه کافی امکان پذیر و قابل اعتماد باشد، تا در جام جهانی از آن استفاده شود، سوالات گوناگونی ایجاد میشوند.
مثلاً چگونه SAOT مکان نه تنها هر بازیکن در زمین، بلکه موقعیت اندام آنها را تا حد میلیمتر تشخیص میدهد؟
داستان چگونگی توسعه این فناوری با مجموعهای متنوع از داستانهای دیگر تلاقی میکند، از رویدادهای واقعی در پشت فیلم Moneyball، حذف انگلستان از جام جهانی 2010، تا منشا فیلترهای بسیار محبوب اسنپ چت!
داستان از تابستان 1966 آغاز میشود.
پروژهای تابستانی که چندین دهه به طول انجامید!
بینایی کامپیوتری، یا آموزش کامپیوتر برای تشخیص بصری اشیا، چیزی است که ممکن است آسان به نظر برسد، اما واقعا سخت و پیچیده است.
به عنوان مثال، وظیفه شناسایی یک پرنده را در نظر بگیرید. میتوان به رایانه یک عکس داد و آموزش داد که الگوی خاصی از پیکسلها به جسمی به نام «پرنده» را تشکیل میدهند. اما پرندهها به اطراف میچرخند. میپرند و حرکت میکنند. الگوی پیکسلها با هر عکس تغییر میکند.
برای آموزش تشخیص پرنده به رایانه، باید به آن یاد دهید که آن پیکسلها را تفسیر کند. شما باید به نوعی به آن یاد دهید که “پرنده” رایج را در میلیونها عکس تشخیص دهد.
به دلایلی، در ابتدا تصور میشد که این کار آسان است.
در سال 1966، ماروین مینسکی، دانشمند کامپیوتر MIT، به یک دانشجوی سال اول کارشناسی را مأمور کرد تا این مشکل را در تابستان حل کند.
سیمون لوسی، مدیر موسسه استرالیایی یادگیری ماشین در دانشگاه آدلاید، میگوید، نیازی به گفتن نیست که دانشجو آن مسئله را حل نکرد، اگرچه کار آنها پایهگذارهای اصلی این رشته بود.
او میگوید: «بسیاری از مردم فکر میکردند که واداشتن ماشینها به اینکه انسانها و اشیا را به گونهای که ما انسانها آنها را میبینیم، ببینند، واقعاً ساده است.
اما معلوم شد که این کار بسیار دشوار است.»
هرچند دهههای بعدی شاهد پیشرفتهای آهستهای بودیم. بهعنوان مثال میتوان به رباتها یاد داد که جعبهها را در خطوط مونتاژ تشخیص دهند یا کدهای پستی دستنویس روی پاکتها را بخوانند، اما این کارها هم به پایان رسید.
سپس، در سال 2012، یک پیشرفت ناگهانی رخ داد.
ظهور Cat filterها
پروفسور لوسی میگوید: “2012 یک نقطه عطف بزرگ بود. ظهور چیزهایی که شبکههای عصبی عمیق نامیده میشدند.”
“[آنها] اساساً به بینایی کامپیوتری اجازه دادند تا از این نوع کنجکاوی تئوریک که دولتها بر اساس آن بودجههای مالی دریافت میکردند… عبور کند. قدرت به شرکتهایی داده شد که واقعاً متوجه شده بودند که میتوان از آنها چه استفادههایی کرد.
از این نقطه عطف در سال 2012، برنامههای بینایی رایانهای که ما هر روز از آنها استفاده میکنیم، مانند Face ID آیفون و جستجوی عکس معکوس Google، و همچنین سیستمهای دیگری که توسط انسانها استفاده میشوند، از نظارت تشخیص چهره گرفته تا ماشینهای پلیسی که پلاکها را اسکن میکنند، روزبهروز بیشتر شدند.
اما نکته اول: شبکه عصبی عمیق (DNN) چیست؟ شبکههای عصبی برای تقلید از نحوه تفکر و یادگیری انسان طراحی شدهاند. آنها از لایههایی از گرهها تشکیل شدهاند، درست مانند مغز انسان که از نورونها تشکیل شده است. گفته میشود شبکه بر اساس تعداد لایههایی که دارد عمیق تر است.
فکر میکنید میتوانید محتوای نوشته شده توسط هوش مصنوعی را تشخیص دهید؟
شاید نام GPT-3 را نشنیده باشید، اما به احتمال زیاد با آن سر و کار داشتهاید، از وبسایتی استفاده کردهاید که کد آن را اجرا میکند، یا حتی از طریق یک چت بات یا یک شخصیت در یک بازی با آن صحبت کردهاید.
کاربرد شبکههای عصبی عمیق
برای آموزش تشخیص پرنده در عکسها به رایانه، میتوان یک DNN را برای انجام این کار با تغذیه مجموعهای از تصاویر حاوی پرندگان و تصاویری که حاوی پرنده نیستند، آموزش داد و هر تصویر را با برچسب «پرنده» یا «غیر پرنده» مشخص کرد.
از طریق تجزیه و تحلیل این تصاویر و جداسازی عناصر تشکیل دهنده شیئی که DNN وظیفه یادگیری آن را بر عهده داشته است (منقار، بال، پر)، دستگاه یاد میگیرد که پرندگان را “مشاهده” کند.
این ایده جدید نیست، اما ظهور رایانههای قدرتمندتر و در دسترس بودن حجم عظیمی از دادهها برای آموزش شبکهها، ایده را به میزان قابل توجهی پختهتر و توانمندتر کرده است.
این دقیقا همان چیزی است که در سال 2012 اتفاق افتاد، زمانی که یک DNN به نام AlexNet رقبای خود را در مسابقه سالانه بینایی کامپیوتری ImageNet در هم شکست.
پروفسور لوسی میگوید: «معمولاً، وقتی فناوری بهبود مییابد، با نوعی خزش مواجه هستیم؛ این فناوری هر سال به آرامی پیش میرود.
“سپس، در سال 2012، این پیشرفت عظیم به وجود آمد که چیستی آن برای همه جهان نامشخص بود”.
سه سال بعد، اولین فیلترهای اسنپ چت عرضه شد. با استفاده از رویکرد AlexNet، آنها با نقشهبرداری از ویژگیهای صورت کاربر، و سپس اضافه کردن یک پوشش هنری، مانند گوشها و بینی حیوانات، کار میکردند.
از مانیبال تا ردیابی خودکار بازیکنان
اما این فناوری فقط برای افزودن سبیل به صورت انسان مفید نبود. در میان کسانی که آن را مورد توجه قرار دادند، شرکت Hawk-Eye هم بود، که در آن زمان بیشتر به خاطر ارائه اشکال شبه خطی در تنیس، یا ترسیم مسیر پیشبینی شده توپ در تصمیمگیریهای وجود یا عدم وجود پای بازیکن قبل از خط دروازه در کریکت شهرت داشت.
اگرچه فناوری ردیابی توپ مفید و چشمگیر بود، اما نیازی به دید کامپیوتری پیشرفته نداشت.
پروفسور لوسی میگوید: “این فناوری در دهه 90 ساخته شد، زیرا برای اینکه بتوانیم توپ زرد تنیس را ردیابی کنیم، نیازی به هوش مصنوعی پیشرفته نداشتیم.”
اما پیشرفت AlexNet امکانات دیگری را برای کاربرد بینایی کامپیوتری در ورزش باز کرد. پیشرفتها در زمانی رخ داد که فیفا، نهاد حاکم بر فوتبال جهان، به دنبال راههایی بود تا در نهایت خطای انسانی مداوم را از تصمیمات داوری حذف کند.
کاتالیزور تغییر زمانی بود که انگلیس پس از باخت به آلمان از جام جهانی 2010 حذف شده بود؛ مسابقهای که گلی که باید برای انگلیس ثبت میشد به طور بحثبرانگیزی مردود اعلام شد.
فیفا دو سال بعد استفاده از فناوری خط دروازه Hawk-Eye و همچنین شرکتهای دادههای ورزشی و تجزیهوتحلیل با توجه به پیشرفتها در بینایی کامپیوتری را تایید کرد.
انقلابی در تحلیل دادهها، سرآغاز تکنولوژی آفساید
در طول دهه گذشته، ورزش حرفهای دستخوش یک انقلاب آرام در تجزیه و تحلیل دادهها شده بود. به طوری که مدیران، استخدامکنندگان و مربیان بهطور فزایندهای تشنه دادههای بازیکنان و مسابقات بودند که اسرار بازی را رمزگشایی میکرد و به تیم آنها برتری میداد.
نمونهای که مکرراً ذکر میشود، موفقیت Oakland Athletic در فصل بیسبال 2002 (که بعداً در فیلم Moneyball در سال 2011 گفته شد)، پس از استفاده از تجزیه و تحلیل کامپیوتری برای خرید بازیکنان جدید بود.
پاتریک لوسی، دانشمند ارشد در شرکت تجزیه و تحلیل ورزش و داده Stats Perform میگوید: «واقعاً، مانیبال سرآغاز تجزیه و تحلیلهای ورزشی بوده است.”
آنها به جای استفاده از شهود انسانی، از تصمیمات مبتنی بر داده استفاده کردند.
پخشکنندهها همچنین میخواستند دادهها پوشش خود را تقویت کنند (مانند «نقشههای حرارتی» که حرکت بازیکن را ردیابی میکند). در حالی که آژانسهای شرطبندی خواستار تحلیلهای پیشبینیکننده مبتنی بر داده بودند.
اما یک مشکل وجود داشت: این دادهها باید به صورت دستی جمعآوری میشد که فوق العاده سخت بود.
دکتر لوسی میگوید: «انسانها بازی را تماشا میکردند و اساساً اندازهگیریهای فیزیکی را انجام میدادند. یعنی فقط میدیدند که چقدر دویدهاند، و سرعت آنها چقدر بوده است».
آنها محل حضور [بازیکن] در هر فریم را ثبت میکردند.”
گروه نامشخصی از انسانها هر فریم از صدها بازی را ثبت میکردند و جزئیاتی را ضبط میکردند، مثلاً زمانی که یک پاس یا شوت اتفاق میافتد، یا اینکه چه کسی کجا قدم گذاشته است.
سیستم Opta برای ردیابی بازیکنان
تا سال 2013، سیستمهای خودکار ایجاد شدند. Stats Perform از بینایی کامپیوتری برای ردیابی توپها و بازیکنان در هر مسابقه NBA استفاده میکرد.
Opta، زیرمجموعه دادههای ورزشی Stats Perform، اکنون بزرگترین ارائهدهنده دادههای فوتبال در جهان است، از جمله برای فوتبال استرالیا. مطمئناً دیدهاید که از دادههای آنها در پوشش بازیها استفاده میشود.
دکتر لوسی میگوید: «ردیابی بازیکنان [خودکار] بیش از یک دهه است که در فوتبال استفاده میشود.
“شما میتوانید گزینههای پاس را در هر فریم اندازه گیری کنید. شما احتمال این را میسنجید که “آیا باید به این بازیکن پاس بدهم، آیا باید به آن بازیکن پاس بدهم. احتمال اینکه در 10 ثانیه آینده فرصت ایجاد کنیم چقدر است؟”
“از طریق این ابزار اندازهگیری و سپس یادگیری ماشینی، ما میتوانیم شروع به اندازه گیری چیزهایی کنیم که قبلا نمیتوانستید اندازه گیری آنها را انجام دهید.”
تکامل و جزییات
تکامل این فناوری، از ردیابی توپ (مثلاً برای تصمیمات LBW)، به ردیابی بازیکنان، و در نهایت، در جام جهانی امسال، به ردیابی اندام بازیکنان رسیده است.
فناوری آفساید نیمه خودکار (SAOT) اولین حضور خود را در جام عرب 2021 انجام داد، اما عمدتاً تا سال 2022 قطر مخفی نگه داشته شده است.
این تکنولوژی تقریباً مانند ردیابی خودکار بازیکنان عمل میکند: دوازده دوربین ثابت در موقعیتهای اطراف استادیوم، 29 نقطه روی بدن هر بازیکن را 50 بار در ثانیه ردیابی میکنند!
رابرت آگی، دانشمند علوم ورزشی از دانشگاه ویکتوریا ملبورن میگوید: «این موضوع خیلی به دوربینها مربوط نمیشود، بلکه بیشتر فناوری پشت آن است.
“این روشی است که تصاویر در آن به مدلسازی ردیابی مهرهای تبدیل میشوند. اعمال و انجام دقیق آن قطعا چالش برانگیز است.”
دانشگاه ویکتوریا یک موسسه تحقیقاتی رسمی فیفا است و پروفسور Aughey دقت SAOT و همچنین سایر سیستمهای داوری نیمه خودکار را آزمایش کرده است.
او میگوید که دوربینها تنها اجزای سیستم نیستند. از آنجایی که آفساید در لحظه ارسال توپ توسط بازیکن مشخص میشود، توپ مورد استفاده در مسابقات جام جهانی دارای حسگری با شتاب سنج و ژیروسکوپ برای اندازهگیری لحظه دقیق زدن آن است.
او میگوید: “اگر به ویدیویی با 50 فریم در ثانیه تکیه میکنید، گاهی اوقات میتوانید نقطه ضربه دقیق را از دست بدهید. ممکن است ضربه دقیقا بین فریمها اتفاق بیفتد.”
این سطح از دقت منجر به قضاوت بازیکنان در آفساید شده، بر اساس فاکتورهایی که در ورزشگاه یا روی صفحه ویدیو قابل مشاهده نیستند.
دقت بالای فناوری
آلن شیرر، مهاجم سابق تیم ملی انگلیس، پس از اینکه گل اکوادور به دلیل آفساید مردود اعلام شد، به بیبیسی گفت: «تا پایان ماه با بیماریهای برآمده از فشار خون بالا مواجه خواهم شد.»
فکر نمیکنم کسی در دنیا این فیلم را تماشا کند که و فکر کند این ضربه آفساید بوده است!
پاسخ پروفسور آگی به این موضوع این است: به اینکه اشتباه بودن قضاوتهایتان ثابت شود عادت کنید!
“این فقط یک مثال از زمانی است که این فناوری میتواند دقیقتر از آنچه با چشم غیرمسلح دیده میشود باشد.
“من فکر می کنم فیفا از [SAOT] بسیار راضی است. اگر لیگ برتر آن را برای فصل آینده معرفی کند، تعجب نمیکنم.”
مسیر فوقالعاده و رو به جلوی فناوری آفساید
پروفسور لوسی از دانشگاه آدلاید میگوید “آنچه در مورد SAOT قابل توجه است این نیست که فقط کار میکند، بلکه فیفا آنقدر به آن اعتماد دارد که معتقد است همیشه به درستی عمل میکند!”
“این سناریوهای پرخطر یک مثال عالی از زمانی است که هوش مصنوعی به طور سنتی با مشکل مواجه شده است.
“میلیاردها نفر در سرتاسر جهان این بازیها را تماشا میکنند، و برای درست بودن قضاوتها به شما اعتماد میکنند. اگر نادرست باشد، منتقدین زیادی خواهید داشت.”
دکتر لوسی در Stats Perform میگوید گام بعدی «تغییر مقیاسها» خواهد بود – راهاندازی ردیابی خودکار بازیکنان، و بینشهای دادهای که اجازه استفاده از این سیستم را به لیگهای پایینتر میدهد. از فوتبال باشگاهی نوجوانان گرفته تا بسکتبال کالج.
«اکنون میتوانید آنچه را که قبلاً نمیتوانستید، اندازهگیری کنید – آنچه فقط بر اساس یک شهود بود.
“دادههای ورزشی در واقع در مورد بازسازی وقایع و داستان مسابقه است. هر چه دادهها دقیقتر باشند، داستان بهتری برای تعریف کردن دارید.”
اما همچنان به نیروهای انسانی احتیاج داریم!
برخی ممکن است این ایده را دوست نداشته باشند که اسرار فوتبال یا هر ورزش دیگری را بتوان به ارقام در یک صفحه گسترده تقلیل داد. حتی این تصور که هر کسی با یک تبلت و دسترسی به دادههای بازیکنان میتواند به خوبی یک مربی کارکشته عمل کند، ممکن است توهینآمیز باشد!
اما، خوشبختانه، این چیزی نیست که دکتر لوسی به آن معتقد است.
او میگوید برخی از معیارها را نمیتوان اندازه گیری کرد. همه متغیرها قابل محاسبه نیستند.
وقتی میتوانیم دادهها را دیجیتالی کنیم، قطعا عملکرد بهتری خواهیم داشت. اما چیزهایی وجود دارد که نمیتوانیم آنها را دیجیتالی کنیم.
“ما نمیدانیم چه چیزی [به بازیکنان] گفته شده است. ما از احساسات حاکم بر بازی اطلاعی نداریم. مطمئن نیستیم که چه کسی در حال خواندن شبکههای اجتماعی است. مطمئن نیستیم که چه کسی با همسرش دعوا کرده است. اطلاع نداریم که فرزند چه کسی بیمار بوده است!”
قبل از جام جهانی، Opta پیشبینی کرد که چه کسی قهرمان خواهد شد. و این پیشبینی اشتباه بود.
برنده پیشبینی شده آنها، برزیل، در مرحله یک چهارم نهایی توسط کرواسی حذف شد.
اوپتا همچنین پیشبینی کرد که مراکش در گروه خود رتبه پایینی خواهد داشت، اما در عوض آنها در صدر قرار گرفتند و سپس تیمهایی که شانس بالاتری داشتند، مانند اسپانیا و پرتغال را، شکست دادند تا به نیمه نهایی راه پیدا کنند.
دکتر لوسی میگوید از آنجایی که بینایی کامپیوتری به قلب ورزش حرفهای نگاه میکند، چیزهایی وجود دارد که نمیتواند ببیند.
“اندازه گیری احتمالات بسیار سخت است.
“وجود این روشهای خودکار میتواند نشانههای بسیار خوبی به ما بدهد، اما قطعیست که انسان باید کنترل را به دست بگیرد.”