کمیت داده مهم است یا کیفیت داده؟

مدت‌هاست که هوش مصنوعی یکی از روندهای خاص اینشورتک‌های مطرح دنیا به شمار می‌رود. روند تازه‌ای که بسیاری از فرآیندهای عملیاتی سنتی و قدیمی صنعت بیمه را سرعت و معنای دیگری بخشید و دریچه‌ای تازه از شفافیت و اعتماد را به سوی مشتریان باز کرد. آنچه در رویه استفاده از هوش مصنوعی در صنایع مختلف دنیا به خصوص صنعت بیمه اهمیت دارد مسئله داده‌هاست، اطلاعاتی ساختار یافته یا ساختارنیافته از مشتری‌ها و مصرف‌کنندگان بازار بیمه که می‌توان به کمک آن الگوی رفتاری مشتریان را مورد بررسی قرار داد و برای شخصی‌سازی و شناخت نیازهای های ر‌وبه‌رشد و به روز آنها همت گماشت. اما مسئله‌ای که امروز دنیای بیمه با آن مواجه است چالش حجم فراوان داده‌ها و کیفیت آنهاست. آیا در صنعت بیمه و روند استفاده از داده‌ها در هوش مصنوعی کیفیت داده‌ها مهم است یا کمیت آنها؟ شبکه نوآفرینی پلنت در این نوشتار به بررسی تأثیر هر دو شاخه در روند به‌کارگیری هوش مصنوعی در بیمه می‌پردازد.

 

داده هر چه بیشتر، بهتر!

هر روز در جهان حدود 2.5 هزار میلیارد بایت داده تولید می‌شود. این رقم طی سال‌های متوالی به سبب ارتباطات گسترده در دنیایی که ما زندگی می‌کنیم هر روز رشد و پیشرفت داشت، داده‌های کلانی که به سبب ارتباطات کلان شبکه‌های اجتماعی، اینترنت چیزها و روی هم رفته دنیای دیجیتال‌زده دور و بر ما هر روز بیشتر و بیشتر روی هم تلنبار شدند. اکوسیستم‌های کلان داده‌ها قادر به ثبت، ذخیره سازی و مدیریت مقادیر زیادی داده هستند. پایه‌ای که می‌تواند اطلاعات مختلف را تجزیه و تحلیل کند و ارزش واقعی آنها را استخراج نماید. در واقع اکوسیستم‌های کلان داده‌ای امروز مانند معادن طلای واقعی برای شرکت‌های بیمه هستند که می‌توانند از ارزش واقعی داده‌ها برای بهبود فرآیندها، به حداقل رساندن هزینه‌ها و یا به حداکثر رساندن سود بهره بگیرند.

طبق گزارش شاخص حفاظت از داده‌های جهانی میزان داده‌های شرکت‌ها از سال 2016 تا 2018 میلادی بالغ بر 596 درصد رشد داشته است. این مقدار زیاد اطلاعات موجود به فرآیند تجزیه و تحلیل داده‌ها کمک می‌کند تا تصمیم‌گیری‌های تجاری را ضریب اطمینان بالاتری به انجام برسانند.

تجزیه و تحلیل‌های پیشرفته مختلف و تکنیک‌های هوش مصنوعی به شرکت‌های بیمه این امکان را می‌دهند تا فرآیندهای کسب و کار را بهتر درک کنند. این تحلیل‌های داده‌ای به صنعت بیمه کمک می‌کند تا بدانند اوضاع از چه قرار است و چه اتفاقاتی در حال روی دادن است (تجزیه و تحلیل توصیفی)، چرا اتفاقی رخ داد (تجزیه و تحلیل تشخیصی) و در آینده چه اتفاقی روی می‌دهد (تجزیه و تحلیل پیشگویانه) و از همه مهم‌تر این که در میان همه چالش‌ها و موارد ممکن بهترین و کم‌ریسک‌ترین گزینه می‌تواند چه باشد. (تجزیه و تحلیل تجویزی)

 

داده باید مرغوب باشد!

درست است که در اختیار داشتن حجم بالای اطلاعات قدرت تجزیه و تحلیل را بالا برده و ابعاد بیشتری از رفتار مشتری و ریسک‌های موجود را پیش روی شرکت‌های بیمه قرار می‌دهد اما در زمینه استفاده از هوش مصنوعی در فرآیندهای عملیاتی بیمه‌ای، در اختیار داشتن حجم بالای داده‌ها با چالشی بزرگ رو به رو است. نزدیک به 80 درصد داده‌های تولیدشده در صنایع مختلف از جمله بیمه فاقد اعتبار و ارزش کافی هستند. درواقع داده‌های جمع‌آوری‌شده به نسبت بسیار بالایی نادرست و ناقص به شمار می‌روند و هیچ ارزشی برای تصمیم‌گیری تجاری نخواهند داشت.

این در حالی است که کیفیت داده‌ها در هنگام اعمال تکنیک‌های هوش مصنوعی بسیار مهم است چرا که نتایج این راهکارهای به کیفیت داده‌های استفاده شده بستگی دارد.

وارد کردن داده‌های نادرست با ریسک‌های بسیاری همراه است. الگوریتم‌هایی که سیستم‌های مبتنی بر هوش مصنوعی را تغذیه می‌کنند تنها زمانی نتایج قابل اعتمادی را در اختیار شرکت‌های بیمه قرار می‌دهند که داده‌های ارائه‌شده به آنها قابل اعتماد باشد. چرا که الگوریتم‌ها خود به تنهایی توانایی تشخیص داده‌های سره از ناسره را ندارند و می‌توانند با ارائه نتایجی نادرست بر اساس داده‌هایی نادرست و ناقص تصمیم‌گیری در سازمان را به خطر بیندازند.