کلانداده میتواند با تمام محدودیتهای بانکی موجود در کشور، سرویس را برای بانکهای ایرانی به ارمغان بیاورد و نحوه تفکر و رویکرد به کسبوکار را عوض کند.
در میزگرد کاربردها و چالشهای کلان داده در صنعت بانکی مطرح شد:
تغییر بهینه رویکرد کسبوکار با مدیریت کلاندادهها میسر است
نشریه تخصصی بانکداری الکترونیک شماره 59 , 10 تير 1394 ساعت 17:25
کلانداده میتواند با تمام محدودیتهای بانکی موجود در کشور، سرویس را برای بانکهای ایرانی به ارمغان بیاورد و نحوه تفکر و رویکرد به کسبوکار را عوض کند.
کلانداده میتواند با تمام محدودیتهای بانکی موجود در کشور، سرویس را برای بانکهای ایرانی به ارمغان بیاورد و نحوه تفکر و رویکرد به کسبوکار را عوض کند.
به گزارش افتانا (پایگاه خبری امنیت فناوری اطلاعات)، این روزها تولید دادهها درنتیجه تراکنشهای خرد و کلان مشتریان بانک با چنان سرعتی در حال رشد است که سازمان فناوری اطلاعات را دچار یک چالش جدی کرده است. شوق و ذوق الکترونیکی شدن اکنون با یک چالش جدی مواجه شده است.
با توجه به اهمیت این موضوع، یک میزگرد تخصصی با حضور دکتر سینا سوهانگیر، فارغالتحصیل دانشگاه استنفورد با پیشینه فعالیت با دادههای بزرگ در توییتر، دکتر صادق علیاکبری، مدرس دانشگاه صنعتی شریف و عضو هیئت مدیره شرکت مشاوره اعوان، مهدی نصیری، مدرس دانشگاه علموصنعت و دکتر فرزاد خندان، مدیرعامل شرکت دادهپردازی سیمیاگران و مهندس عبدالرضا شریفیحسینی، معاون بانکداری الکترونیکی بانک آینده در مرکز فابا برگزار شد.
در ادامه آنچه را که در این میزگرد گذشت، در ساختار گفتگوی چندجانبه پیش روی علاقهمندان میگذاریم:
دکتر بیات: موضوع کلانداده (Big data) در حوزه کسبوکارها و بهویژه شبکه بانکی کشور موضوع چندان شناختهشدهای نیست. لذا ضرورت دارد روی مفهوم و کاربردهای آن در کسبوکارها صحبت کنیم تا مخاطبان ما با آن بیشتر آشنا شوند و در کار خود از آن بهره ببرند. لذا از دوستان خواهش میکنیم طرح بحث کنند.
مفهومشناسی
دکتر خندان: خوب است در ابتدا بررسی کنیم وقتی صحبت از Big data میکنیم، منظورمان چه چیزی است و این روند از چه زمانی در دنیا مطرح شده است و اساساً وقتی هوش تجاری وجود داشت چه ضرورتی داشت که وارد حوزه کلانداده شویم؟
دکتر سوهانگیر: بحث Big data در ابتدا با تبلیغات شروع شده است. در هوش تجاری ما یک سری داده داریم که هدف از کنکاش در آن مشخص است و بعد از تحلیل به یک سری نتایجی میرسیم اما در موضوع تبلیغات، هوش تجاری چندان جایگاه ندارد. برای یک تبلیغکننده چندان مهم نیست که بینندگان چه کسانی هستند و روی آنها تحقیق کند. هدف این است که تبلیغات با کارایی بیشتری به بیننده نشان داده شود و برایشان جذابتر باشد.
دکتر خندان: پس میتوان گفت مسئله این نیست که کلانداده یک امر تبلیغاتی است بلکه اولین کاربرد آن صنعت تبلیغات بود.
دکتر سوهانگیر: بله، همینطور است و دلیلش هم این بود که در صنعت تبلیغات هر وقت کاربری در مقابل یک مرورگری قرار میگیرد، تعاملی انجام میَشود و دادههایی تولید میَشوند. کار کلانداده این است که آن دادهها را بگیرد و آنالیز کند.
حجم این دادهها در مقایسه با مثلاً تعاملات بانکی خیلی بیشتر است، بنابراین شرکتهای تبلیغات دیجیتال اولین کاربران آن بودند. البته گوگل علاوه بر استفاده تبلیغاتی، آنالیز وب را هم با آن انجام داد و اینکه چگونه جستجو کند، اما موقعی این کار باب شد که تبلیغات آنلاین خیلی مرسوم شده بود. چون حجم تعامل کاربران با وب و موبایلشان آنقدر زیاد بود که برای انجام هر کار معناداری، یکجور Big data اتفاق میافتد، لذا انجام محاسبات با یک کامپیوتر شدنی نیست و مجبور هستید آن را روی گروهی از کامپیوترها پخشکنید و محاسبات را انجام دهید.
دکتر خندان: بالاخره فرق کلانداده (Big Data) با دادههای خرد (Small Data) چیست؟
دکتر سوهانگیر: فرق آنها در این است که هرچیزی را نتوان روی یک کامپیوتر انجام داد و تعدادی کامپیوتر را باید در خدمت گرفت که آن محاسبات را انجام دهد، کار Big data میشود. البته در بحث تبلیغات هیچ کار دیگری نمیشد انجام داد و واقعاً مجبور به انجام این کار بودند، اما بعد از شروع کلانداده و ایجاد زیرساخت، یک سری کارهایی که بهطور سنتی در جای دیگر انجام میشد با این روش پیش رفت. مثلاً یک زمانی آمریکن اکسپرس تعداد زیادی متخصص داده استخدام کرده بود که فقط دادههای بانک را آنالیز میکردند و نمیدانستند دنبال چه چیزی هستند. با زیرساخت کلانداده، میتوان محاسبات بیشتر و دقیقتر و بزرگتری بر روی دادهها انجام داد و میتوان آدمها را باهم همبسته کرد که چه کسانی با هم رفتار مشابه دارند. این کار شاید قبل از ایجاد آن زیرساخت نه در فکر کسی بود و نه لازم بود، ولی با این زیرساخت، قابل انجام شد.
دکتر علیاکبری: چند نکته را در این زمینه که کلانداده چیست، از کجا آمده و با مدلهای قبلی مثل هوش تجاری چه فرقی دارد، عرض میکنم:
در بحث کلانداده، مدل ساختمان دادههایی که با آنها کار میکنیم، مقداری متفاوت شده است. دادههای قبلی معمولاً ساختارمند و از پیش قابل توصیف بودند مثلاً میگوییم داده یک کاربر در بانک چنین ساختاری دارد و با همان دادهها کار میشد و تغییر در ساختار دادهها خیلی کم بود.
در کلانداده، تغییرات ساختاری هم خیلی زیاد است. یعنی هم دادهها زیادند، هم زیاد تغییر میکنند، هم ساختمان آنها تغییر میکند. امروز برای کاربر یک گونه اطلاعات را نگه میداریم، روز دیگر اطلاعات دیگر و ساختمان دادهای که این دادهها استفاده میشوند نیز بهصورت پویا تغییر میکند. این مسئله باعث میشود که مدلهای سنتی مورداستفاده مخصوصاً دیتابیسهای رابطهای، کمکم ناکارآمد شوند.
یک دوره خیلی طولانی کل بازار در دست دیتابیسهای رابطهای مثل اوراکل، SQL SERVER و مانند آنها بود ولی این دیتابیسها از پس کاربردهای جدید برنمیآیند.
یک نکته دیگر، در کاربردهای جدید، خیلی اوقات نیازهایی را که در دیتابیسهای قدیم داشتیم دیگر نداریم. مثلاً بحث تراکنش، بهروز شدن لحظهای در همه پایگاهها یا سازگاری لحظهای، اینها مربوط به پایگاه دادههای رابطهای است و در کاربردهای جدید خیلی اوقات لازم نیستند. به همین خاطر نیازمندیها را سادهتر میکنند تا با کارایی بالاتری کار کنند. ضمن اینکه کاربردهای سنتی دیتابیسها، سرجای خود باقی است. احتمالاً تا چند سال آینده بخش زیادی از دادهها روی دیتابیسهای رابطهای باقی میمانند و هوش تجاری همچنان مهم باقی میماند. درواقع هوش تجاری و کلانداده هرکدام یک موضوع مجزا هستند که در جاهایی به هم تنه میزنند. اگر حجم دادهها زیاد شود و تغییرات در آنها زیاد باشد هوش تجاری باید از یک زیرساخت کلانداده استفاده کند. لذا کاربردهای سنتی سرجای خود است و برای برخی نیازهای جدید، کلانداده به وجود آمده است و اینها همدیگر را نفی نمیکنند.
پلتفرمها
دکتر خندان: تکنولوژیهایی (پلت فرم) که در این زمینه به وجود آمدهاند کداماند و آینده آن به چه سمتی خواهد رفت؟
دکتر سوهانگیر: کلانداده عملاً با گوگل شروع شد. گوگل در سال ۲۰۰۴ مقالهای منتشر کرد و بدون دادن اطلاعات بیشتر از سورس کد، اعلام کرد پلت فرمی به نام MapReduce ایجاد کردیم و محاسباتمان را اینگونه انجام میدهیم.
در آن موقع تعدادی از استادان دانشگاهها و متخصصان با آن مخالفت کردند و این شیوه را ناکارآمد دانستند اما گروهی دیگر تلاش کردند معادل متنباز آن را ایجاد کنند که به Hadoop منجر شد که الان شناخته شده است.
این کار در حدود سالهای ۲۰۰۷ خیلی باب شد و هنوز هم هادوپ در مؤسسات و حتی بانکها مورداستفاده قرار میگیرد. دو شرکت نیز شکل گرفت که این پلت فرم متنباز را بهعنوان خدمات به کسبوکارهایی میفروشند که دقت و صحت دادهها برایشان مهم است مثل بانکها که میخواهند مطمئن باشند آیا این پلتفرم آمادگی محاسبات و عملیات مدنظر آنها را دارد یا نه؟ شرکتی مثل cloudera این پلت فرم را آماده میکند و نیازهای آنها را تضمین میکند.
در ادامه ماجرا، گوگل از تکنولوژیهای جدیدتری استفاده کرد. یکی از مشکلات هادوپ و MapReduce این است که ذاتاً از روشهایی استفاده میکنند که کند است. هر بار که بخواهید روی یک pc، محاسباتی انجام دهید، دادهها روی هارد نوشته میشود، هرکدام از کامپیوترها از روی هارددیسک خودشان خوانده و محاسباتی انجام میدهند و دوباره روی هارددیسک خودشان مینویسند. این دادهها بین هارددیسکها تقسیم و جابهجا میشود و فرایند از نو انجام میگیرد؛ بنابراین هر مرحله از این عملیات یک مرحله خواندن و نوشتن روی هارد دارد. این باعث میشد که فرایند خیلی کند باشد که با فلسفه Big data برای انجام محاسبات سریع تعارض دارد. به همین خاطر گوگل پلتفرم جدیدی به نام dremel تولید کرد. بهطور موازی در دانشگاه برکلی پروژهای به نام spark راه افتاد که اینها نسلهای جدید کلانداده هستند ولی محدودیتهای قبلی را ندارند.
برای اسپارک هم شرکتی تأسیس شده که آمارهای ارائهشده نشان میدهد تا الان هم بیش از ۴۰ میلیون دلار سرمایه جذب کرده است و گفته میشود ۱۰ تا ۱۰۰ برابر از هادوپ سریعتر است ولی هنوز یک پروژه تحقیقاتی محسوب میَشود و برای مثال Bank of America یا آمریکن اکسپرس از آن استفاده نمیکنند با در مقیاس خیلی کوچک بهره میبرند. حتی در توییتر هم که بودم با وجود شناخت از این تکنولوژی و زبان مشترک برنامهنویسی اسکالا (scala) از آن استفاده نمیکردند.
در حال حاضر، نسخه ۳/۱ اسپارک درآمده است و شرکتهایی که با آن کار میکنند معتقدند به یک تکنولوژی بالغ تبدیل شده است.
نسل بعدی چیزی شبیه اسپارک است و به نظر میرسد اسپارک برنده بازی کلانداده خواهد بود. بیشترین فعالیتها هماکنون روی اسپارک و اسکالا است و بیشترین حقوق مهندسان هم مربوط به کسانی است که با اسپارک کار میکنند.
بنابراین در تکنولوژی کلانداده احتمالاً اسپارک برنده بازی خواهد بود و بهزودی جای هادوپ را خواهد گرفت. البته هادوپ ۴ بخش دارد که سه قسمت از آن خواهد ماند و درنهایت با تکنولوژی جدید جایگزین خواهد شد و اسپارک فقط یک بخش را جابهجا میکند که این نکته خیلی مثبتی است چون پذیرش آن را آسانتر میکند.
دکتر خندان: اگر یک مرور اجمالی بر بخش اول صحبتها داشته باشیم، کلانداده با داده خرد فرق دارد به این خاطر که حجم بیشتری داده داریم و سرعت بیشتری برای پردازش آنها نیاز داریم و به سمت پردازش آنلاین در حرکت هستیم. ضمن اینکه سرعت تولید داده خیلی بالاست.
امروزه در زمینه کلانداده پلت فرمهایی داریم که نسبتاً بالغ هستند. دو پلت فرم هادوپ و اسپارک وجود دارند که اسپارک جدیدتر است و احتمالاً در آینده اقبال به آن هم بیشتر خواهد شد و به نظر میرسد در دنیا امروزه با محصول روبهرو هستیم و استفاده واقعی از این فناوری صورت میگیرد. اینها پلت فرمهایی هستند که با وجود سابقه کم بهسرعت به مرحله بهرهبرداری رسیدهاند و دیگر تنها یک چیز آزمایشی نیستند.
نصیری: همانطور که اشاره شد وقتی دادههای ما از لحاظ حجم، تنوع و ابعاد دادهها زیاد میَشود، با مبحث کلانداده روبهرو هستیم. گرچه mapreduce در سال ۲۰۰۴ معرفی شد اما پیشینه آن شاید سال ۹۱ بوده است که اینترنت معرفی شد و تولید دادهها سرعت گرفت بعد با دیتابیسهای ارتباطی روبهرو هستیم و بعد از آن با NOSQL مواجه هستیم و بعدتر اینترنت اشیا آمده که اینها همه در روند ایجاد کلانداده خیلی مؤثر بودند. صحبت از اسپارک شد، این پلت فرم شاید به این دلیل آینده بهتری داشته باشد که تحلیل دادهها برای سازمانها مهمتر است مثل دادهکاوی. این مسئله روی اسپارک خیلی بهتر میتواند انجام شود تا معماری هادوپ.
معماریهای دیگری هم ارائه شده است مثلاً فیسبوک یک معماری ارائه داده است یا معماریهایی که برای دادههای نوع گراف ارائه میشود که اینها در حال توسعه است و گارتنر هم اعلام کرده است در سال ۲۰۱۶ سازمانهایی که از کلانداده استفاده کنند، میتوانند تا ۲۰ درصد از نظر درآمدی جلوتر از دیگران باشند. این مسئله بهخصوص مباحث تحلیلی آنها جز مباحث داغ است و نیازهایی که وجود دارد اطلاعاتی راجع به مشتریان بهدست بیاوریم، با توجه به تنوع و حجم دادهها این ساختارها بهتر از ساختارهای سنتی میتواند به ما کمک کند و خیلی از جاها میتوانند با هوش تجاری مکمل هم باشند و هوش تجاری بر روی ساختار آنها مستقر شود.
دکتر خندان: ما تا الان در مورد چند وجه کلانداده صحبت کردیم. یکی حجم بود، یکی سرعت تولید دادهها و دیگری تنوع ساختاری که دادههای ساختار نیافته و ساختاریافته در کنار هم هستند. نکته دیگر حذف محدودیتهایی است که در روشهای قدیمی وجود دارد و این یک مسئلهای را به نام validity پیش میآورد. وقتی در هنگام ورود دادهها صحت سنجی صورت نگیرد، مجبوریم در هنگام آنالیز به آن توجه کنیم. لذا چهار مفهوم volume، variety،velocity و validity را میتوان پایههای اصلی مفهوم کلانداده برشمرد.
دکتر علیاکبری: چیزی هم هست که همه آنها را کلاً در برمیگیرد و آن ارزش دادههاست (data value) یعنی سعی میشود بدون توجه به اینکه به چه درد میخورد، دادهها را نگهداری و تحلیل کنند.
دکتر خندان: از مفهوم و پلتفرمهای کلانداده صحبت کردیم. اکنون سؤال این است که این فناوری چه کاربردهایی میتواند داشته باشد؟
دکتر شریفیحسینی: کلانداده میتواند کاربردهای خیلی جدی داشته باشد، البته هنوز استفاده از پلتفرم در کشور رایج نیست و تا آنجا که من میدانم شاید تنها یکی دو بانک به سمت آن رفتهاند، آنهم در سطح تحقیقات و هیچ برنامه کاربردی تاکنون نداشته است.
جدیترین کاربرد در بانک میتواند cross- sales باشد. ما با کلانداده میتوانیم فروش منطقهای ایجاد کنیم و با تحلیل دادهای که انجام میشود میتوان به مشتری چیزی را پیشنهاد کرد که شاید اصلاً به فکر فروش آن نبوده است. بهعنوان نمونه یک موردی را مثال میزنم که نه با کلانداده ولی با مدلهای دیگری سعی کرده است این کار را بکند.
اکنون مبین نت کار جالبی میکند؛ اگر مشتری در تهران باشد، یک محصول با یک قیمت پیشنهاد میشود و اگر در شیراز یا یزد باشد هرکدام محصول دیگری با قیمتهای دیگر پیشنهاد میکند و کاملاً فروش خود را منطقهای کرده است. این شرکت برای انجام این کار CDR مشتریها را در یک دیتابیس خیلی بزرگ میریزد و بعد از روی میانگین حضور آنها در یک منطقه، وطن آنها را تشخیص میدهد. اگر کسی که وطنش شیراز است از هرکجا وصل شود، به آن CDR تحلیلی پشت سیستم کار دارد. عین همین کار را میتوان در بانک انجام داد و محصولات سپردهای یا تسهیلاتی را براساس رفتار قبلی مشتری درست کرد که مناسب حال او باشد. مثلاً یک مشتری هست که تسهیلات یک قسطی را راحتتر پرداخت میکند. میتوان از روی رفتار او در بانک، محصول مناسب به او پیشنهاد کرد.
موضوع دیگر که بانکها میتوانند از این فناوری استفاده کنند و بانک مرکزی هم به آن فکر میکند، کشف تقلب است.
بانک مرکزی بعد از عید امسال اعلام کرد سقف تراکنش روی پایانههای فروش ۵۰ میلیون تومان باشد و در دنباله بخشنامه مقرر کرده است بانکها ظرف سهماه خودشان را تجهیز کنند که اگر مبلغ کل خریدها روی یک حساب بیش از ۵۰ میلیون تومان میشود، یک تأیید از مشتری باید بگیرند.
در حال حاضر مشتری تراکنشهای کلان خود را به چند نوبت تقسیم کرده است ولی با اجرای بند دوم بخشنامه که بانکها ظرف سه ماه باید خودشان را تجهیز کنند، روی این مسئله باید ابزار کشف تقلب وجود داشته باشد و بانکها ناچارند چنین کاری بکنند. اینکه این کارت قبلاً در کجا خرید میکرده است؟ وطن کارت کجاست؟ چقدر ریسک دارد و موارد مشابه، بهناچار باید روی پلت فرم کلانداده بیاید. به نظر من خیلی از تجربههای کشف تقلب در کشور ما به این خاطر پا نگرفت که ظرفیت پردازش وجود نداشت. چند بانک خیلی جدی به این موضوع ورود کردند، محصول خریدند و نصب کردند ولی به خاطر اینکه ظرفیت پردازش نداشتند، پروژه پیش نرفته است.
نصیری: وقتی بحث تقلب مطرح میشود، مشکلی که وجود دارد عدم وجود زیرساخت است و خیلی جاها دنبال این هستند که این کار بهصورت آنی انجام شود. مثلاً اگر کارت سرقت شد، بلافاصله این چک شود و اگر خیلی وضعیت حاد است با صاحب کارت تماس و تأیید گرفته شود که این ایجاب میکند زیرساختهای کلانداده را به کار بگیریم.
موضوعی که در کشف تقلب خیلی مشکلساز است و در محصولات داخلی که در حال حاضر داریم، وجود دارند، بحث تشخیص غلط (false positive) است. در موضوع پولشویی هم که چند سال پیش بانک مرکزی اعلام کرد باید ۱۱ قاعده پیادهسازی شود، علاوه بر مبهم بودن خود قواعد، در مرحله دوم با مشکل تشخیص غلط (false positive) روبهرو بودیم. آنچه بانک مرکزی اعلام کرده بود، بیشتر قاعده بود تا تحلیل و روی آن قواعد هم خیلی کار نشده بود که تشخیص غلط آنها را کم کند. بهطورکلی در تحلیلهایی که ما دادههای نامتوازن داریم مثل تقلب که نسبت تقلب به کل تراکنشها خیلی کم است، مشکل تشخیص غلط بهصورت جدی وجود دارد که باید برای آن فکری کرد.
شریفیحسینی: خیلی از بخشهای تقلب با ابزارهای فعلی قابل پیداکردن نیست و اجبارا باید به پلتفرمهای کلانداده رجوع کنیم. برای مثال چیزی که تحت عنوان ذینفع واحد در بانکها شناخته میشود، نیاز به جستجو در میان انبوهی از شرکتها دارد. اگر از ابهام بخشنامهها هم بگذریم، فرض قرار است به کسی که ذینفع است، وام ندهیم چه خودش باشد یا بستگان او یا شرکتهایی که داخل آن سهام دارد یا عضو هیئتمدیره است. پیدا کردن این ارتباطها وقتی تعداد پروندههای تسهیلاتی زیاد میشود، اصلاً کاری نیست که بشود روی پلتفرمهای ساده انجام داد.
مثال دیگر اینکه، یکی از انواع تقلب، تبانی کارمند و مشتری است که این کار معمولاً شامل شبکه پیچیدهای از آدمها میَشود. مثلاً فردی در تهران با افراد دیگری در زاهدان و خوزستان با هم تبانی میکنند. این کارها بهراحتی یک قاعده ساده نیستند و حتی قاعدهای نیست که با چند پارامتر قابل چک کردن و کنترل باشد. در اینجا حتی نوع دادهها هم ساختارمند نیست و باید دنبال دادههای تسهیلات، اعتبارات، عملیات بانکی روزمره و ... باشیم. یک جاهایی این تقلب پنهان میشود که پردازش آنها فقط در پلتفرمهای کلانداده میسر است.
ریزش مشتری
کاربرد بعدی که برای بانکها در شرایط رقابتی امروز مهم میشود، ریزش مشتری است. مشتری که دیگر مایل نیست با بانک کار کند، رفتاراو قابل ردیابی است و با پردازش اطلاعات او میتوان تشخیص داد که این مشتری مثلاً سه ماه دیگر در صورت اقدام نکردن، بانک را رها خواهد کرد. ولی اگر کمپینی درست کنیم که با پردازش و شناخت رفتار او بتوانیم او را بشناسیم، میتوان با اقدام مناسب مانع رفتن او شد. ریزش هر مشتری ممکن است به یک علتی باشد و هرکدام به نوبه خود این علامت را به سازمان رساندهاند ولی ممکن است این علامت در میان انبوه اطلاعات گم شده باشد؛ یکی به خاطر درخواست تسهیلات، یکی به خاطر برخورد بد کارمند. یک مشتری ممکن است با تلفن اعلام کرده باشد، دیگری از طریق وب سایت بانک و ... .
چون جاهایی که ممکن است مشتری ناراحت شود زیاد است، دادهها ساختار نیافته است. لذا لازم است کار زیادی انجام شود تا بتوان دلایل ریزش را فهمید و بعد برای مشتری کمپین درست کرد و او را به بانک برگرداند. یا ممکن است بخواهیم مشتریانی را که ظرف سالهای گذشته از بانک رفتهاند بشناسیم. این کار ممکن است نیاز به بررسی دادههای چندین سال داشته باشد که از عهده روشهای ساده برنمیآید.
نصیری: اگر بخواهیم یک مثال عینی بزنیم در اواخر سال ۹۱ که رقابت بر سر سود سپردهها در میان بانکها تشدید شد، مسئله ریزش مشتری خیلی جدی شد. برای بانکهایی که ریزش داشتند این مسئله مهم بود که تشخیص بدهند چه مشتریانی در حال رفتن از بانک هستند یا در آینده بهآرامی از بانک مهاجرت خواهند کرد. در یکی از بانکها که ما این مسئله را بررسی میکردیم هیئتمدیره درخواست داشت بهسرعت معلوم شود که چه مشتریانی در حال حاضر در حال بیرون رفتن از بانک هستند. عرض من این است که گاهی یک اتفاق خاص بازه بررسی را ممکن است خیلی کوتاه کند و فرصت ارزیابی یک هفته یا ۱۰ روز باشد.
با تنوع دادهها، رفتارهای مختلف و دلایلی متفاوتی روبهرو هستیم که ممکن است مشتری بانک را ترک کند. معمولاً عدم رضایت هم بهآرامی شکل میگیرد. در تجارت داریم که هزینه جذب مشتری شش برابر نگهداری مشتری است وقتی بتوان از خروج مشتری جلوگیری کرد، بنابراین چندین برابر به نفع بانک است. این کاری است که کلانداده میتواند کمک کند تا گروههای مختلف مشتریان را شناسایی کند تا برحسب هرکدام پیشنهادهای مشخص و متناسب با آنها ارائه شود و از رفتن مشتری جلوگیری بشود.
شخصیسازی خدمات
دکتر خندان: این موضوع که پیشنهادهای شخصی (customized offers) به مشتری ارائه شود یک کاربرد خیلی جدی در مبحث کلانداده است. این مسئله به نظر من یکی از انقلابهایی است که کلانداده با خود میآورد. لذا کلانداده یک تغییر پارادایم در تکنولوژی است که تغییر ماهوی در نحوه بهرهبرداری از اطلاعات ایجاد میکند و نمیتوان آن را با هوش تجاری مقایسه کرد.
در صنعت خودرو ما در چند مقطع با تغییر پارادایم روبهرو بودیم که یکی تولید انبوه توسط فورد، دیگری تولید خودروهای کممصرف در دهه ۱۹۷۰ و آخری شخصیسازی است که از سالهای ۱۹۹۰ به بعد پیش آمد که از آن به (mass customization) یاد میشود. با ظهور اینترنت و دسترسی مستقیم به تولیدکننده، مشتری میتوانست خودرویی را سفارش بدهد که رنگ، تجهیزات فنی و بسیاری از بخشهای آن به انتخاب خودش باشد. این مسئله خط تولید خودرو را مشخص میکند یعنی از روی اطلاعات مشتریان برنامهریزی تولید انجام میشود.
امروز با مبحث کلانداده این اتفاق در صنعت IT در حال رخ دادن هست؛ یعنی میتوان شرکتی مثل گوگل یا فیسبوک بود و براساس رفتار و نیازهای مشتری، مشتری به مشتری، پیشنهادهای متفاوتی ارائه کرد نه حتی منطقهای بلکه فردبهفرد و این چیزی است که امروزه باعث تغییر پارادایم در حوزه کسبوکار فناوری اطلاعات شده است، هرچند که در زمینه فناوری ممکن است تغییر پارادایم نباشد.
همین الان برای بانکها میتوان بدون نیاز به تغییر قوانین و هیچ بار اضافی حقوقی، مکانیزم وامهای خرد را برای مشتریان راه انداخت بهاینترتیب که مشتریان را براساس اطلاعات قبل و براساس مکانیزمهای کلانداده میتوان بخشبندی کرد، الگوهای رفتاری را مشخص کرد و مثلاً مشتریان را میتوان به ۲۰۰ کلاس اعتباری تقسیم کرد که هرکدام از کلاسها یک رفتاری دارند و به ازای هرکدام یک وجه مشخصه (pattern signature) مشخص کرد مثلاً معلمین، پزشکان، وکلا و طبقهبندیهای دیگری که میتوان انجام داد. بعد بر مبنای این تقسیمبندی به سهولت میتوان نیازهای خرد تسهیلاتی را بدون نیاز به فرایند طولانی ارائه درخواست و آوردن ضامن و ... برطرف کرد.
اگر بتوان این طبقهبندی را انجام داد، فرآیند کلاً عوض میشود. برای یک مشتری ممکن است نیاز به هیچگونه عملیاتی نباشد و بهمحض تمام شدن پول فرد، خود بانک پیشنهاد بدهد. قطعاً پیشنهادی که اینگونه داده میشود به چیزی که مشتری نیاز دارد خیلی نزدیکتر است و احتمال خریدن این پیشنهاد بسیار بالاتر خواهد بود و این میتواند یک چیز جدیدی را به صنعت بانکداری ما اضافه کند. ما در حال حاضر در مقایسه با بانکهای مطرح دنیا مثل HSBC خدمت خاصی به مشتریان نمیدهیم. کلانداده میتواند با تمام محدودیتهای بانکی ما، سرویس را برای بانکهای ایرانی به ارمغان بیاورد و نحوه تفکر و رویکرد به کسبوکار را عوض کند.
نصیری: این بحث خیلی جدی است که رفتار هر مشتری با مشتری دیگر متفاوت است. بحث شخصیسازی خدمات موضوع روز است که از سالهای گذشته در کنفرانس KDD بهعنوان معتبرترین کنفرانس دادهکاوی موضوع مسابقه بوده است.
حتی رفتار فرد هم در مقاطع مختلف متفاوت است. لذا با آنالیز میتوان خدمات متفاوتی را پیشنهاد کرد. خروجی این مباحث را میتوان با هوش تجاری ترکیب کرد و مکمل هم تحلیل انجام داد.
تغییر پارادایم
دکتر بیات: به تغییر پارادایم اشاره شد. مناسب است در این خصوص بیشتر صحبت کنیم، برای اینکه مخاطبان بانکی ما آمادگی فکری و عملی لازم را برای تغییر در خود فراهم کنند. چون تغییر پارادایم یک تغییر عمده است که میتواند چالشهایی را ایجاد کند.
دکتر سوهانگیر: تغییر پارادایم را از دو دید میتوان نگاه کرد: کاربران و مدیران. برای کاربران نسل اول اینترنت، وبسایتها همه شبیه هم بود اما الان دیگر اینطور نیست و امروزه کار به جایی رسیده است که گوگل آنچه را که به افراد ارائه میکند، فردبهفرد متفاوت است و این باعث میشود تجربه افراد متفاوت باشد. این کار یک حسن و خوبی دارد و یک بدی. بدی این است که گوگل است که تعیین میکند که چه کسی چه چیزی ببیند. این شخصیسازی باعث میشود که هم آدمها درکشان از اینترنت و محیط متفاوت باشد هم درک شرکتها از آدمها، تکتک تغییر کند. این مسئله بهعنوان یک نکته مثبت میتواند باعث شود رفتار بانک با اشخاص دچار تغییر شود؛ بنابراین افراد از لحاظ اجتماعی هم مسئولیتپذیرتر میَشوند وسعی میکنند رفتارشان را کنترل کنند، به این خاطر که رفتار بد فرد منعکس میشود و نتیجهاش را خواهد دید، درصورتیکه در گذشته شخص برای عبور از چراغ قرمز واهمهای نداشت.
این تغییر را در محیط آنلاین هم داریم. با افراد به نسبت رفتارشان، به نسبت به اینکه فرد در چه فضایی است و چهکار میکند، میتوان برخورد متفاوت کرد. ازاینجهت واقعاً تغییر پارادایم است و دیگر آدمها را یکجور نگاه نمیکنیم.
در اقتصاد مبحثی به نام تبعیض قیمت وجود دارد. گرچه به لحاظ فرهنگی ممکن است این مسئله موردقبول نباشد ولی از لحاظ اقتصادی یک بهینه یابی است و از هرکس باید متناسب با مقداری که میتواند خرج کند، پول گرفت. حتی در این سطح کلان هم، کلانداده میتواند به کارایی و بهرهوری یک اقتصاد کمک کند.
دکتر علیاکبری: این تغییر پارادایم یک چیز قطعی است. کاربران سیستمهای جدید، جور دیگری از سیستمها استفاده میکنند و آنچه میبینند متفاوت از گذشته است. ولی از پشتصحنهها هم نباید غافل شویم. در وضعیت جدید مدیران پشت سیستمها هم سیستمهای خود را به گونه دیگری مدیریت میکنند؛ یعنی این تغییر را در آنجا هم میتوان دید. مباحث BI و DSS در آنجا پررنگ میشود و تکنولوژی هوش تجاری به آنها خیلی خیلی کمک میکند و مدیران هم گزارشهای دیگری میخواهند، به گونه دیگری تحلیل میکنند و چون دادهها زیاد است روشهای جدیدی لازم دارند و برای این موضوع ممکن است هزینههای زیادی هم انجام دهند. گفته میشود در انتخابات ریاست جمهوری قبلی آمریکا باراک اوباما یک تیم کلانداده داشته است که توییتر را آنالیز کردند فقط برای رصد اخبار و توییتها برای اینکه بفهمند روند به چه سمتی است و بهتر است در سخنرانی بعدی روی چه موضوعاتی تمرکز کند. این مثال خیلی به کاربران ارتباطی ندارد و از یک سیستم تصمیمگیری استفاده شده است که کوچکترین تغییر در آن میتواند نتیجه زیادی داشته باشد. این پارادایم شیفت در تکنولوژی خیلی شدید بوده است و کاربران عام و خاص آن را احساس میکنند.
کسبوکار و چالشها
دکتر بیات: اگر ممکن است به الزامات و چالشهای استفاده از کلانداده هم بپردازیم. این کار چه زیرساختهایی لازم دارد و با چه موانعی به خصوص در کشور ممکن است روبهرو شود؟
دکتر سوهانگیر: اینکه چگونه میتوان مباحث کلانداده را به یک کسبوکار تبدیل کرد، سؤال مهمی است. باتوجه به اینکه من در فضای سیلیکون ولی واستنفورد بودم حس کلی من این است که در آنجا هر تکنولوژی جدید که میآید، آنقدر حرفهای با آن برخورد میکنند که جان میگیرد و تبدیل به یک کسبوکار میشود. مثلاً اگر قرار بود بحث کلانداده را ابتدا بانکها به آن نگاه کنند و به یک کسبوکار تبدیل کنند، خیلی متفاوت میَشد تا اینکه یک عده سرمایهگذار شرکتی درست کردند و آنها شروع به ارائه سرویس کردند. این مساله دوتا ذهینت متفاوت است. فکر نمیکنم کسی در این قضیه که کلانداده امروزه به یک ضرورت تبدیل شده است شکی داشته باشد و شاید در آینده نزدیک سازمانهایی که داده دارند اگر از دادههای خود استفاده نکنند، به آنهایی که از دادههایشان استفاده میکنند، خواهند باخت.
در مورد الزامات هم باید بگویم، خوشبختانه اغلب نرمافزارهایی که برای کلانداده لازم است متن باز هستند و کسی که در ایران نشسته با کسی که در سانفرانسیسکو هست، تفاوتی ندارد. مهم بحث نیروی انسانی و آموزش آن است برای اینکه از نیروی انسانی آموزش دیده چگونه استفاده شود و یک چرخهای درست شود که برای آن نیروی انسانی نفع داشته باشد که در این کسبوکار باقی بماند و شروع به کار تحلیل داده بکند وگرنه بقیه ملزومات چه سرورها و چه دیتابیس کمابیش در ایران هم وجود دارد. من فکر میکنم در این چرخه آن چه از همه مهمتر است، درست کردن یک کسبوکار سودده است و این که چگونه نیروی انسانی تربیت کنیم که داخل این فضا بتواند به زندگی خود ادامه دهد و کار کند.
در سیلیکون ولی بحث کلانداده طبیعتاً باگوگل شروع شد ولی شما به هرکدام از شرکتهای دیگر مثل فیس بوک یا توئیتر بروید، ساختار این شرکتها شبیه یک کپی از روی گوگل است چون آدمهایی که ابتدا در گوگل بودند، بعد به توئیتر بعد به فیس بوک رفتند. خیلی از شرکتها هم هستند که سرمایهگذاری هم در آنها صورت گرفته است ولی به جایی نرسیدهاند، اما آنچه در آنجا اهمیت دارد، آموزش نیروی انسانی است یعنی در این فرایندی که سرمایهگذاری شد، یک گروه مهندس، آموزشی دیدند و یک فرآیندی را طی کردند و حتی اگر محصول خودشان به جایی نرسید به شرکت بعدی میروند و درآنجا یک کار خیلی مفید انجام میدهند.
منظورم این است که اگر ایران یا تهران را در نظر بگیریم و اگر کلانداده وجود داشته باشد و شرکتها شروع به آنالیز داده بکنند، ممکن است در برخی موارد نتیجه خاصی هم گرفته نشود ولی همین که روی این موضوع سرمایهگذاری میشود، متخصصانی تربیت میشوند که در پروژههای بعدی مفید خواهند بود به شرطی که زمینه فعالیت آنها را در کشور ایجاد کنیم تا بعد از مدتی از کشور مهاجرت نکنند.
مهندس شریفی حسینی: به نظر من یکی از چالشهایی که ما امروز داریم، همین مزیتی است که دکتر سوهانگیر اشاره کردند که نرمافزارها متن باز است و دسترسی به سرورها و دیتابیس هم وجود دارد. نتیجه نگاه این میشود که بانکها میگویند خودمان کار را انجام میدهیم. این تصمیم منجر به این میشود که در چارچوب سازمانی، به دنبال جذب نیرو با فیلترهای سازمانی میروند، در حالی که دانش و تخصص فرد چندان مهم نیست. بعد از آن وارد فرآیند ساختمان و تعریف پروژه میشوند در نهایت بعد از چند سال و صرف هزینه، عملاً چیزی دست بانک را نگرفته است. به نظر من این مسئله خودش یک چالش است.
اولین کاری که ما باید بکنیم این است که به بانکها بگوییم شما کار بانکداری بکنید و یک متخصص فناوری اطلاعات هم کار کلانداده بکند. کار بخش فناوری اطلاعات و مدیر فناوری هم نزدیک کردن برنامهها با این شرکتی است که قرار است مجری باشد. میخواهم تاکید کنم که اینگونه پروژهها اگر برونسپاری نشود، انتهای آن فقط شکست است.
نصیری: من یک مثال خاص بانکی میزنم. بانکها دیدند اگر پروژهای را برونسپاری کنند به آن شرکت وابسته مطلق میشوند. برای همین منظور شرکتهای خصوصی ثبت کردند. این مساله باعث شده است شرکتهایی که غیر از شرکت خود بانک هستند نتوانند در پروژههای بانکی وارد شوند. یک گونه رانت برای این شرکتها درست شده است. کما اینکه در بانک پروژهای تعریف میشود که شرکتهای بیرونی زیادی وجود دارند و حاضرند کار خوبی ارائه کنند اما کار به شرکت داخلی واگذار میَشود و بعد از چند سال با شکست پروژه مواجه میشوند.
چالش دیگری که وجود دارد و سمت متخصصان فناوری اطلاعات است نه بانک، این است که متخصصان این حوزه هم طبقهبندی شده و شناخته شده نیستند که بانک بداند کار را به چه کسی واگذار کند.
دکتر خندان: در مطلبی که فوربس راجع به مدلهای کسبوکار کلانداده نوشته بود، به استارتآپها پیشنهاد کرده بود، این کار هیچ پیشزمینهای نمیخواهد با داشتن مقداری زمینه داده کاوی کار را با مشاوره شروع کنید و ضمن آن تیم فنی خود را تقویت کنند و مثالهای زیادی آورده بود که اینگونه شرکتهای تازهکار وارد حوزه کاری کلانداده شده بودند.
نصیری: من میخواهم به این مساله اشاره کنم که ما در تمام کارها یک دانش نیاز داریم و یک تجربه، فوت و فن را با هم لازم داریم. آن کسی که از دانشگاه میآید فقط از نظر فن قوی است و تجربه لازم را ندارد. در حوزه کلانداده، فوتهای کار خیلی کلیدی و مهم هستند. ارزش تجربه در این فناوری خیلی بیشتر از حوزههای دیگر است.
چالشهای داخلی
دکتر بیات: به چالش نیروی انسانی و مدیریتی در این حوزه اشاره شد. همچنین اینکه تشخیص سره و ناسره متخصصان از هم دشوار است. چه چالشهای دیگری وجود دارد و چگونه باید با این چالشها مقابله کرد؟
مهندس شریفی حسینی: یک چالش اصلی این است که متخصصان فناوری اطلاعات، مسئول کسبوکار بانک نیستند. لذا نیروهای بخش کسبوکار نیاز به آموزش جدی در این حوزه دارند که مستلزم صرف وقت و کار زیاد است که شاید سهلالوصول هم نباشد به این خاطر که به راحتی نمیتوان اعضای هیأت مدیره یک بانک را سر یک کلاس نشاند. تازه بعد از متقاعد کردن آنها و پیداکردن فرصت این کار، ممکن است از نظر آنها این کار راه دور دستیابی به ثروت باشد و آنها موافق راههای کوتاهتری برای پول درآوردن و پیش بردن امور خود باشند. به نظر من از زمانی این اتفاق در کشور میتواند شکل بگیرد که شرایط اقتصادی کشور پایدار شود و کارهایی مثل خلق پول اتفاق نیافتد که خیال بانکها بابت منابع جدید راحت باشد و ناچار باشند که از راه دادههای خودشان به منفعت برسند در آن زمان است که کلانداده پا میگیرد وگرنه در حال حاضر مدیران انگیزهای برای این کار ندارند.
نصیری: در نظرسنجی که دانشگاه بوستون انجام میدهد در مورد چالشهای کلانداده، بزرگترین چالش از سال ۲۰۰۹ همیشه کیفیت دادهها بوده است. چالش محرمانگی همیشه جزء ۳ چالش اول بوده است و بانک تمایلی ندارد دادههای خود را در اختیار یک نهاد بیرونی بگذارد. یک چالش دیگر ارائه این مباحث برای صاحبان کسبوکارها و توجیه آنهاست.
در جاهایی که اقتصاد پایداری دارند، پول، پول تولید نمیکند بلکه کار است که ارزش افزوده ایجاد میکند اما در ایران پول، پول تولید میکند لذا اگر بانک پول داشته باشد انگیزهای ندارد که در این زمینهها سرمایهگذاری کند.
دکتر سوهانگیر: به هرحال کار کلانداده کارآمد کردن تصمیمگیریهاست. حتی برای گزینههای واسطهگری مثل سرمایهگذاری در املاک و ... که در کشور طرفدار بیشتری دارد با استفاده از کلانداده میتوان تشخیص بهتری داشت و تصمیم بهتری گرفت.
راهاندازی کسبوکار
دکتر خندان: به نظر من مسئله این نیست که ارزش افزودهای که با IT میتوان به دست آورد کمتر از سرمایهگذاری در سایر حوزههاست بلکه این است که هیأت مدیره و مدیران تصمیمگیر کسبوکارهای ما از جمله بانکداری با این فضا چندان آشنا نیستند که چگونه میتوانند با راههای خیلی سریعتر و مطمئنتر از سفتهبازی از دادهها ثروت تولید کنند. تقصیر این مسئله هم متوجه آنها نیست و به متخصصان IT بر میگردد که باید نحوه کسبوکار در حوزه فناوری را یاد بدهند و با ایجاد ارزش به توسعه بازار آن کمک کنند.
مهندس شریفی حسینی: اینجاست که میتوان گفت جای شرکتهای بزرگ مشاورهای که در دنیا هستند در کشور خالی است. مثلاً مشابه دیلویت ما در کشور نداریم. آنها هستند که IT را به صنعت نزدیک میکنند.
دکتر خندان: امروزه استارتآپها هم میتوانند این نقش را ایفا کنند و با راهاندازی کسبوکارهای کوچک از طریق IT پول در بیاورند. ما هم ناچاریم به این سمت حرکت کنیم چون اقتصاد ما ناچار است از درآمدهای نفتی فاصله بگیرد.
دکتر علیاکبری: در مورد چالشهای ایران یک نکته عرض کنم. مدلهای کسبوکار کلانداده، دوگونه است یا برون سپاری یا درون سپاری. چه راهی میتوان انتخاب کرد که ریسکهای دو روش را کم کند؟ به نظر میرسد راهحل شرکتهای مشاوره به معنای خاص مشاوره باشد. شرکتهایی که فقط مشورت نمیدهند بلکه زیرساخت در اختیار شرکتها قرار میدهند مثل شرکت Cloudera که یک بانک لزوماً تحلیل سیستم خود را به آنها نمیدهد. این شرکت زیرساختهایی آماده میکند از جنس زیرساختهای فنی و نیروی متخصص آموزش میدهد که این نیروها را میتواند کرایه دهد. این موضوع چیزی است که ما در ایران نداریم. این که منابع متنساز هستند فرصت خیلی خوبی است ولی فرق ما با سانفرانسیسکو شاید این باشد که آنها این شرکتهای مشاوره را دارند و اکوسیستم آنها کامل است اما در کشور همه چیز یا باید برون سیاری کامل شود یا درون سیاری و هر دوی این روشها ریسک بالایی دارند، چون پروژههای کلانداده طول عمر کوتاهی ندارند ولی متاسفانه طول عمر مدیریتها در کشور خیلی کوتاهتر از آن است که این پروژه به ثمر برسد.
یک چالش داخلی دیگر این است که مدیران عموماً به این حوزهها به چشم یک محصول نگاه میکنند؛ یعنی دوست دارند که یکباره یک محصول Big Data بخرند و بعد از آن سودشان تغییر محسوس کند در حالی که این کار یک فرایند است، باید روی آن سرمایهگذاری شود، محصول زیرساختی ایجاد شود، فرهنگ سازمانی ایجاد شود، نیروی انسانی متخصص پرورش داده شود و این شرکتها به مرور ایجاد شوند. شرکتهایی که کار انجام نمیدهند اما به انجام آن کمک میکنند. مسئولیت کار ممکن آ ست در بانک یا شرکت فناوری بانک بماند ولی برای زیرساختها به دنبال دانلود هادوپ و اختراع چرخ از ابتدا نباشند، از این شرکتها کمک بگیرند و زیرساخت بخرند نه محصول. البته در ایران یک فرصت هم وجود دارد که ممکن است خارج از ایران نباشد. اقتصاد کشور اقتصاد بستهای است و مخصوصاً از بعد امکانات سختافزاری قدرت مانور ما به اندازه گوگل و فیسبوک نیست. در کشور هنوز مدیران بانکی به دنبال خرید سختافزارهای متمرکز گرانقیمت هستند. با این که اقتصاد در مضیقه است اما همه میخواهند z۱۰ آی بیام را بخرند در حالی که کلانداده میتواند با قیمتهای خیلی کمتر دادهها را روی سرورهای خیلی ارزانتر توزیع و پردازش کند و هزینهها را کاهش دهد. حال که به دلیل تحریمها نمیتوان z۱۰ خرید، به جای آن ۱۰۰ سرور ارزان قیمت بخریم. البته این کار زمان میخواهد و این گونه نیست که امروز محصول بخریم مثل تجربه ایران خودرو که محصول SAP خرید ولی به دلیل آماده نبودن سازمان و فرهنگ سازمانی به موفقیت نرسید. باید متخصصان فناوری اطلاعات و کسبوکارها در کنار هم قرار بگیرند و به یک فهم مشترک برسند.
کد مطلب: 9758