تغییر بهینه رویکرد کسب‌وکار با مدیریت کلان‌داده‌ها میسر است

کلان‌داده می‌تواند با تمام محدودیت‌های بانکی موجود در کشور، سرویس را برای بانک‌های ایرانی به ارمغان بیاورد و نحوه تفکر و رویکرد به کسب‌وکار را عوض کند.

به گزارش افتانا (پایگاه خبری امنیت فناوری اطلاعات)، این روزها تولید داده‌ها درنتیجه تراکنش‌های خرد و کلان مشتریان بانک با چنان سرعتی در حال رشد است که سازمان فناوری اطلاعات را دچار یک چالش جدی کرده است. شوق و ذوق الکترونیکی شدن اکنون با یک چالش جدی مواجه شده است.

با توجه به اهمیت این موضوع، یک میزگرد تخصصی با حضور دکتر سینا سوهان‌گیر، فارغ‌التحصیل دانشگاه استنفورد با پیشینه فعالیت با داده‌های بزرگ در توییتر، دکتر صادق علی‌اکبری، مدرس دانشگاه صنعتی شریف و عضو هیئت مدیره شرکت مشاوره اعوان، مهدی نصیری، مدرس دانشگاه علم‌وصنعت و دکتر فرزاد خندان، مدیرعامل شرکت داده‌پردازی سیمیاگران و مهندس عبدالرضا شریفی‌حسینی، معاون بانکداری الکترونیکی بانک آینده در مرکز فابا برگزار شد.

در ادامه آنچه را که در این میزگرد گذشت، در ساختار گفتگوی چندجانبه پیش روی علاقه‌مندان می‌گذاریم:

دکتر بیات: موضوع کلان‌داده (Big data) در حوزه کسب‌وکارها و به‌ویژه شبکه بانکی کشور موضوع چندان شناخته‌شده‌ای نیست. لذا ضرورت دارد روی مفهوم و کاربردهای آن در کسب‌وکارها صحبت کنیم تا مخاطبان ما با آن بیشتر آشنا شوند و در کار خود از آن بهره ببرند. لذا از دوستان خواهش می‌کنیم طرح بحث کنند.

مفهوم‌شناسی
دکتر خندان: خوب است در ابتدا بررسی کنیم وقتی صحبت از Big data می‌کنیم، منظورمان چه چیزی است و این روند از چه زمانی در دنیا مطرح شده است و اساساً وقتی هوش تجاری وجود داشت چه ضرورتی داشت که وارد حوزه کلان‌داده شویم؟

دکتر سوهان‌گیر: بحث Big data در ابتدا با تبلیغات شروع شده است. در هوش تجاری ما یک سری داده داریم که هدف از کنکاش در آن مشخص است و بعد از تحلیل به یک سری نتایجی می‌رسیم اما در موضوع تبلیغات، هوش تجاری چندان جایگاه ندارد. برای یک تبلیغ‌کننده چندان مهم نیست که بینندگان چه کسانی هستند و روی آنها تحقیق کند. هدف این است که تبلیغات با کارایی بیشتری به بیننده نشان داده شود و برایشان جذاب‌تر باشد.

دکتر خندان: پس می‌توان گفت مسئله این نیست که کلان‌داده یک امر تبلیغاتی است بلکه اولین کاربرد آن صنعت تبلیغات بود.

دکتر سوهان‌گیر: بله، همین‌طور است و دلیلش هم این بود که در صنعت تبلیغات هر وقت کاربری در مقابل یک مرورگری قرار می‌گیرد، تعاملی انجام می‌َشود و داده‌هایی تولید می‌َشوند. کار کلان‌داده این است که آن داده‌ها را بگیرد و آنالیز کند.

حجم این داده‌ها در مقایسه با مثلاً تعاملات بانکی خیلی بیشتر است، بنابراین شرکت‌های تبلیغات دیجیتال اولین کاربران آن بودند. البته گوگل علاوه بر استفاده تبلیغاتی، آنالیز وب را هم با آن انجام داد و اینکه چگونه جستجو کند، اما موقعی این کار باب شد که تبلیغات آنلاین خیلی مرسوم شده بود. چون حجم تعامل کاربران با وب و موبایل‌شان آن‌قدر زیاد بود که برای انجام هر کار معناداری، یک‌جور Big data اتفاق می‌افتد، لذا انجام محاسبات با یک کامپیوتر شدنی نیست و مجبور هستید آن را روی گروهی از کامپیوترها پخش‌کنید و محاسبات را انجام دهید.

دکتر خندان: بالاخره فرق کلان‌داده (Big Data) با داده‌های خرد (Small Data) چیست؟

دکتر سوهان‌گیر: فرق آنها در این است که هرچیزی را نتوان روی یک کامپیوتر انجام داد و تعدادی کامپیوتر را باید در خدمت گرفت که آن محاسبات را انجام دهد، کار Big data می‌شود. البته در بحث تبلیغات هیچ کار دیگری نمی‌شد انجام داد و واقعاً مجبور به انجام این کار بودند، اما بعد از شروع کلان‌داده و ایجاد زیرساخت، یک سری کارهایی که به‌طور سنتی در جای دیگر انجام می‌شد با این روش پیش رفت. مثلاً یک زمانی آمریکن اکسپرس تعداد زیادی متخصص داده استخدام کرده بود که فقط داده‌های بانک را آنالیز می‌کردند و نمی‌دانستند دنبال چه چیزی هستند. با زیرساخت کلان‌داده، می‌توان محاسبات بیشتر و دقیق‌تر و بزرگ‌تری بر روی داده‌ها انجام داد و می‌توان آدم‌ها را باهم همبسته کرد که چه کسانی با هم رفتار مشابه دارند. این کار شاید قبل از ایجاد آن زیرساخت نه در فکر کسی بود و نه لازم بود، ولی با این زیرساخت، قابل انجام شد.

دکتر علی‌اکبری: چند نکته را در این زمینه که کلان‌داده چیست، از کجا آمده و با مدل‌های قبلی مثل هوش تجاری چه فرقی دارد، عرض می‌کنم:

در بحث کلان‌داده، مدل ساختمان داده‌هایی که با آنها کار می‌کنیم، مقداری متفاوت شده است. داده‌های قبلی معمولاً ساختارمند و از پیش قابل توصیف بودند مثلاً می‌گوییم داده یک کاربر در بانک چنین ساختاری دارد و با همان داده‌ها کار می‌شد و تغییر در ساختار داده‌ها خیلی کم بود.

در کلان‌داده، تغییرات ساختاری هم خیلی زیاد است. یعنی هم داده‌ها زیادند، هم زیاد تغییر می‌کنند، هم ساختمان آنها تغییر می‌کند. امروز برای کاربر یک گونه اطلاعات را نگه می‌داریم، روز دیگر اطلاعات دیگر و ساختمان داده‌ای که این داده‌ها استفاده می‌شوند نیز به‌صورت پویا تغییر می‌کند. این مسئله باعث می‌شود که مدل‌های سنتی مورداستفاده مخصوصاً دیتابیس‌های رابطه‌ای، کم‌کم ناکارآمد شوند.

یک دوره خیلی طولانی کل بازار در دست دیتابیس‌های رابطه‌ای مثل اوراکل، SQL SERVER و مانند آنها بود ولی این دیتابیس‌ها از پس کاربردهای جدید برنمی‌آیند.

یک نکته دیگر، در کاربردهای جدید، خیلی اوقات نیازهایی را که در دیتابیس‌های قدیم داشتیم دیگر نداریم. مثلاً بحث تراکنش، به‌روز شدن لحظه‌ای در همه پایگاه‌ها یا سازگاری لحظه‌ای، این‌ها مربوط به پایگاه داده‌های رابطه‌ای است و در کاربردهای جدید خیلی اوقات لازم نیستند. به همین خاطر نیازمندی‌ها را ساده‌تر می‌کنند تا با کارایی بالاتری کار کنند. ضمن اینکه کاربردهای سنتی دیتابیس‌ها، سرجای خود باقی است. احتمالاً تا چند سال آینده بخش زیادی از داده‌ها روی دیتابیس‌های رابطه‌ای باقی می‌مانند و هوش تجاری همچنان مهم باقی می‌ماند. درواقع هوش تجاری و کلان‌داده هرکدام یک موضوع مجزا هستند که در جاهایی به هم تنه می‌زنند. اگر حجم داده‌ها زیاد شود و تغییرات در آنها زیاد باشد هوش تجاری باید از یک زیرساخت کلان‌داده استفاده کند. لذا کاربردهای سنتی سرجای خود است و برای برخی نیازهای جدید، کلان‌داده به وجود آمده است و این‌ها همدیگر را نفی نمی‌کنند.

پلت‌فرم‌ها
دکتر خندان: تکنولوژی‌هایی (پلت فرم) که در این زمینه به وجود آمده‌اند کدام‌اند و آینده آن به چه سمتی خواهد رفت؟

دکتر سوهان‌گیر: کلان‌داده عملاً با گوگل شروع شد. گوگل در سال ۲۰۰۴ مقاله‌ای منتشر کرد و بدون دادن اطلاعات بیشتر از سورس کد، اعلام کرد پلت فرمی به نام MapReduce ایجاد کردیم و محاسبات‌مان را این‌گونه انجام می‌دهیم.

در آن موقع تعدادی از استادان دانشگاه‌ها و متخصصان با آن مخالفت کردند و این شیوه را ناکارآمد دانستند اما گروهی دیگر تلاش کردند معادل متن‌باز آن را ایجاد کنند که به Hadoop منجر شد که الان شناخته شده است.

این کار در حدود سال‌های ۲۰۰۷ خیلی باب شد و هنوز هم هادوپ در مؤسسات و حتی بانک‌ها مورداستفاده قرار می‌گیرد. دو شرکت نیز شکل گرفت که این پلت فرم متن‌باز را به‌عنوان خدمات به کسب‌وکارهایی می‌فروشند که دقت و صحت داده‌ها برایشان مهم است مثل بانک‌ها که می‌خواهند مطمئن باشند آیا این پلت‌فرم آمادگی محاسبات و عملیات مدنظر آنها را دارد یا نه؟ شرکتی مثل cloudera این پلت فرم را آماده می‌کند و نیازهای آنها را تضمین می‌کند.

در ادامه ماجرا، گوگل از تکنولوژی‌های جدیدتری استفاده کرد. یکی از مشکلات هادوپ و MapReduce این است که ذاتاً از روش‌هایی استفاده می‌کنند که کند است. هر بار که بخواهید روی یک pc، محاسباتی انجام دهید، داده‌ها روی هارد نوشته می‌شود، هرکدام از کامپیوترها از روی هارددیسک خودشان خوانده و محاسباتی انجام می‌دهند و دوباره روی هارددیسک خودشان می‌نویسند. این داده‌ها بین هارددیسک‌ها تقسیم و جابه‌جا می‌شود و فرایند از نو انجام می‌گیرد؛ بنابراین هر مرحله از این عملیات یک مرحله خواندن و نوشتن روی هارد دارد. این باعث می‌شد که فرایند خیلی کند باشد که با فلسفه Big data برای انجام محاسبات سریع تعارض دارد. به همین خاطر گوگل پلت‌فرم جدیدی به نام dremel تولید کرد. به‌طور موازی در دانشگاه برکلی پروژه‌ای به نام spark راه افتاد که این‌ها نسل‌های جدید کلان‌داده هستند ولی محدودیت‌های قبلی را ندارند.

برای اسپارک هم شرکتی تأسیس شده که آمارهای ارائه‌شده نشان می‌دهد تا الان هم بیش از ۴۰ میلیون دلار سرمایه جذب کرده است و گفته می‌شود ۱۰ تا ۱۰۰ برابر از هادوپ سریع‌تر است ولی هنوز یک پروژه تحقیقاتی محسوب می‌َشود و برای مثال Bank of America یا آمریکن اکسپرس از آن استفاده نمی‌کنند با در مقیاس خیلی کوچک بهره می‌برند. حتی در توییتر هم که بودم با وجود شناخت از این تکنولوژی و زبان مشترک برنامه‌نویسی اسکالا (scala) از آن استفاده نمی‌کردند.

در حال حاضر، نسخه ۳/۱ اسپارک درآمده است و شرکت‌هایی که با آن کار می‌کنند معتقدند به یک تکنولوژی بالغ تبدیل شده است.

نسل بعدی چیزی شبیه اسپارک است و به نظر می‌رسد اسپارک برنده بازی کلان‌داده خواهد بود. بیشترین فعالیت‌ها هم‌اکنون روی اسپارک و اسکالا

است و بیشترین حقوق مهندسان هم مربوط به کسانی است که با اسپارک کار می‌کنند.

بنابراین در تکنولوژی کلان‌داده احتمالاً اسپارک برنده بازی خواهد بود و به‌زودی جای هادوپ را خواهد گرفت. البته هادوپ ۴ بخش دارد که سه قسمت از آن خواهد ماند و درنهایت با تکنولوژی جدید جایگزین خواهد شد و اسپارک فقط یک بخش را جابه‌جا می‌کند که این نکته خیلی مثبتی است چون پذیرش آن را آسان‌تر می‌کند.

دکتر خندان: اگر یک مرور اجمالی بر بخش اول صحبت‌ها داشته باشیم، کلان‌داده با داده خرد فرق دارد به این خاطر که حجم بیشتری داده داریم و سرعت بیشتری برای پردازش آنها نیاز داریم و به سمت پردازش آنلاین در حرکت هستیم. ضمن اینکه سرعت تولید داده خیلی بالاست.

امروزه در زمینه کلان‌داده پلت فرم‌هایی داریم که نسبتاً بالغ هستند. دو پلت فرم هادوپ و اسپارک وجود دارند که اسپارک جدیدتر است و احتمالاً در آینده اقبال به آن هم بیشتر خواهد شد و به نظر می‌رسد در دنیا امروزه با محصول روبه‌رو هستیم و استفاده واقعی از این فناوری صورت می‌گیرد. این‌ها پلت فرم‌هایی هستند که با وجود سابقه کم به‌سرعت به مرحله بهره‌برداری رسیده‌اند و دیگر تنها یک چیز آزمایشی نیستند.

نصیری: همان‌طور که اشاره شد وقتی داده‌های ما از لحاظ حجم، تنوع و ابعاد داده‌ها زیاد می‌َشود، با مبحث کلان‌داده روبه‌رو هستیم. گرچه mapreduce در سال ۲۰۰۴ معرفی شد اما پیشینه آن شاید سال ۹۱ بوده است که اینترنت معرفی شد و تولید داده‌ها سرعت گرفت بعد با دیتابیس‌های ارتباطی روبه‌رو هستیم و بعد از آن با NOSQL مواجه هستیم و بعدتر اینترنت اشیا آمده که این‌ها همه در روند ایجاد کلان‌داده خیلی مؤثر بودند. صحبت از اسپارک شد، این پلت فرم شاید به این دلیل آینده بهتری داشته باشد که تحلیل داده‌ها برای سازمان‌ها مهم‌تر است مثل داده‌کاوی. این مسئله روی اسپارک خیلی بهتر می‌تواند انجام شود تا معماری هادوپ.

معماری‌های دیگری هم ارائه شده است مثلاً فیس‌بوک یک معماری ارائه داده است یا معماری‌هایی که برای داده‌های نوع گراف ارائه می‌شود که این‌ها در حال توسعه است و گارتنر هم اعلام کرده است در سال ۲۰۱۶ سازمان‌هایی که از کلان‌داده استفاده کنند، می‌توانند تا ۲۰ درصد از نظر درآمدی جلوتر از دیگران باشند. این مسئله به‌خصوص مباحث تحلیلی آنها جز مباحث داغ است و نیازهایی که وجود دارد اطلاعاتی راجع به مشتریان به‌دست بیاوریم، با توجه به تنوع و حجم داده‌ها این ساختارها بهتر از ساختارهای سنتی می‌تواند به ما کمک کند و خیلی از جاها می‌توانند با هوش تجاری مکمل هم باشند و هوش تجاری بر روی ساختار آنها مستقر شود.

دکتر خندان: ما تا الان در مورد چند وجه کلان‌داده صحبت کردیم. یکی حجم بود، یکی سرعت تولید داده‌ها و دیگری تنوع ساختاری که داده‌های ساختار نیافته و ساختاریافته در کنار هم هستند. نکته دیگر حذف محدودیت‌هایی است که در روش‌های قدیمی وجود دارد و این یک مسئله‌ای را به نام validity پیش می‌آورد. وقتی در هنگام ورود داده‌ها صحت سنجی صورت نگیرد، مجبوریم در هنگام آنالیز به آن توجه کنیم. لذا چهار مفهوم volume، variety،velocity و validity را می‌توان پایه‌های اصلی مفهوم کلان‌داده برشمرد.

دکتر علی‌اکبری: چیزی هم هست که همه آنها را کلاً در برمی‌گیرد و آن ارزش داده‌هاست (data value) یعنی سعی می‌شود بدون توجه به اینکه به چه درد می‌خورد، داده‌ها را نگهداری و تحلیل کنند.

دکتر خندان: از مفهوم و پلت‌فرم‌های کلان‌داده صحبت کردیم. اکنون سؤال این است که این فناوری چه کاربردهایی می‌تواند داشته باشد؟

دکتر شریفی‌حسینی: کلان‌داده می‌تواند کاربردهای خیلی جدی داشته باشد، البته هنوز استفاده از پلت‌فرم در کشور رایج نیست و تا آنجا که من می‌دانم شاید تنها یکی دو بانک به سمت آن رفته‌اند، آن‌هم در سطح تحقیقات و هیچ برنامه کاربردی تاکنون نداشته است.

جدی‌ترین کاربرد در بانک می‌تواند cross- sales باشد. ما با کلان‌داده می‌توانیم فروش منطقه‌ای ایجاد کنیم و با تحلیل داده‌ای که انجام می‌شود می‌توان به مشتری چیزی را پیشنهاد کرد که شاید اصلاً به فکر فروش آن نبوده است. به‌عنوان نمونه یک موردی را مثال می‌زنم که نه با کلان‌داده ولی با مدل‌های دیگری سعی کرده است این کار را بکند.

اکنون مبین نت کار جالبی می‌کند؛ اگر مشتری در تهران باشد، یک محصول با یک قیمت پیشنهاد می‌شود و اگر در شیراز یا یزد باشد هرکدام محصول دیگری با قیمت‌های دیگر پیشنهاد می‌کند و کاملاً فروش خود را منطقه‌ای کرده است. این شرکت برای انجام این کار CDR مشتری‌ها را در یک دیتابیس خیلی بزرگ می‌ریزد و بعد از روی میانگین حضور آنها در یک منطقه، وطن آنها را تشخیص می‌دهد. اگر کسی که وطنش شیراز است از هرکجا وصل شود، به آن CDR تحلیلی پشت سیستم کار دارد. عین همین کار را می‌توان در بانک انجام داد و محصولات سپرده‌ای یا تسهیلاتی را براساس رفتار قبلی مشتری درست کرد که مناسب حال او باشد. مثلاً یک مشتری هست که تسهیلات یک قسطی را راحت‌تر پرداخت می‌کند. می‌توان از روی رفتار او در بانک، محصول مناسب به او پیشنهاد کرد.

موضوع دیگر که بانک‌ها می‌توانند از این فناوری استفاده کنند و بانک مرکزی هم به آن فکر می‌کند، کشف تقلب است.

بانک مرکزی بعد از عید امسال اعلام کرد سقف تراکنش روی پایانه‌های فروش ۵۰ میلیون تومان باشد و در دنباله بخشنامه مقرر کرده است بانک‌ها ظرف سه‌ماه خودشان را تجهیز کنند که اگر مبلغ کل خریدها روی یک حساب بیش از ۵۰ میلیون تومان می‌شود، یک تأیید از مشتری باید بگیرند.

در حال حاضر مشتری تراکنش‌های کلان خود را به چند نوبت تقسیم کرده است ولی با اجرای بند دوم بخشنامه که بانک‌ها ظرف سه ماه باید خودشان را تجهیز کنند، روی این مسئله باید ابزار کشف تقلب وجود داشته باشد و بانک‌ها ناچارند چنین کاری بکنند. اینکه این کارت قبلاً در کجا خرید می‌کرده است؟ وطن کارت کجاست؟ چقدر ریسک دارد و موارد مشابه، به‌ناچار باید روی پلت فرم کلان‌داده بیاید. به نظر من خیلی از تجربه‌های کشف تقلب در کشور ما به این خاطر پا نگرفت که ظرفیت پردازش وجود نداشت. چند بانک خیلی جدی به این موضوع ورود کردند، محصول خریدند و نصب کردند ولی به خاطر اینکه ظرفیت پردازش نداشتند، پروژه پیش نرفته است.

نصیری: وقتی بحث تقلب مطرح می‌شود، مشکلی که وجود دارد عدم وجود زیرساخت است و خیلی جاها دنبال این هستند که این کار به‌صورت آنی انجام شود. مثلاً اگر کارت سرقت شد، بلافاصله این چک شود و اگر خیلی وضعیت حاد است با صاحب کارت تماس و تأیید گرفته شود که این ایجاب می‌کند زیرساخت‌های کلان‌داده را به کار بگیریم.

موضوعی که در کشف تقلب خیلی مشکل‌ساز است و در محصولات داخلی که در حال حاضر داریم، وجود دارند، بحث تشخیص غلط (false positive) است. در موضوع پول‌شویی هم که چند سال پیش بانک مرکزی اعلام کرد باید ۱۱ قاعده پیاده‌سازی شود، علاوه بر مبهم بودن خود قواعد، در مرحله دوم با مشکل تشخیص غلط (false positive) روبه‌رو بودیم. آنچه بانک مرکزی اعلام کرده بود، بیشتر قاعده بود تا تحلیل و روی آن قواعد هم خیلی کار نشده بود که تشخیص غلط آنها را کم کند. به‌طورکلی در تحلیل‌هایی که ما داده‌های نامتوازن داریم مثل تقلب که نسبت تقلب به کل تراکنش‌ها خیلی کم است، مشکل تشخیص غلط به‌صورت جدی وجود دارد که باید برای آن فکری کرد.

شریفی‌حسینی: خیلی از بخش‌های تقلب با ابزارهای فعلی قابل پیداکردن نیست و اجبارا باید به پلت‌فرم‌های کلان‌داده رجوع کنیم. برای مثال چیزی که تحت عنوان ذی‌نفع واحد در بانک‌ها شناخته می‌شود، نیاز به جستجو در میان انبوهی از شرکت‌ها دارد. اگر از ابهام بخشنامه‌ها هم بگذریم، فرض قرار است به کسی که ذی‌نفع است، وام ندهیم چه خودش باشد یا بستگان او یا شرکت‌هایی که داخل آن سهام دارد یا عضو هیئت‌مدیره است. پیدا کردن این ارتباط‌ها وقتی تعداد پرونده‌های تسهیلاتی زیاد می‌شود، اصلاً کاری نیست که بشود روی پلت‌فرم‌های ساده انجام داد.

مثال دیگر اینکه، یکی از انواع تقلب، تبانی کارمند و مشتری است که این کار معمولاً شامل شبکه پیچیده‌ای از آدم‌ها می‌َشود. مثلاً فردی در تهران با افراد دیگری در زاهدان و خوزستان با هم تبانی می‌کنند. این کارها به‌راحتی یک قاعده ساده نیستند و حتی قاعده‌ای نیست که با چند پارامتر قابل چک کردن و کنترل باشد. در اینجا حتی نوع داده‌ها هم ساختارمند نیست و باید دنبال داده‌های تسهیلات، اعتبارات، عملیات بانکی روزمره و ... باشیم. یک جاهایی این تقلب پنهان می‌شود که پردازش آنها فقط در پلت‌فرم‌های کلان‌داده میسر است.

ریزش مشتری
کاربرد بعدی که برای بانک‌ها در شرایط رقابتی امروز مهم می‌شود، ریزش مشتری است. مشتری که دیگر مایل نیست با بانک کار کند، رفتاراو قابل ردیابی است و با پردازش اطلاعات او می‌توان تشخیص داد که این مشتری مثلاً سه ماه دیگر در صورت اقدام نکردن، بانک را رها خواهد کرد. ولی اگر کمپینی درست کنیم که با پردازش و شناخت رفتار او بتوانیم او را بشناسیم، می‌توان با اقدام مناسب مانع رفتن او شد. ریزش هر مشتری ممکن است به یک علتی باشد و هرکدام به نوبه خود این علامت را به سازمان رسانده‌اند ولی ممکن است این علامت در میان انبوه اطلاعات گم شده باشد؛ یکی به خاطر درخواست تسهیلات، یکی به خاطر برخورد بد کارمند. یک مشتری ممکن است با تلفن اعلام کرده باشد، دیگری از طریق وب سایت بانک و ... .

چون جاهایی که ممکن است مشتری ناراحت شود زیاد است، داده‌ها ساختار نیافته است. لذا لازم است کار زیادی انجام شود تا بتوان دلایل ریزش را فهمید و بعد برای مشتری کمپین درست کرد و او را به بانک برگرداند. یا ممکن است بخواهیم مشتریانی را که ظرف سال‌های گذشته از بانک رفته‌اند بشناسیم. این کار ممکن است نیاز به بررسی داده‌های چندین سال داشته باشد که از عهده روش‌های ساده برنمی‌آید.

نصیری: اگر بخواهیم یک مثال عینی بزنیم در اواخر سال ۹۱ که رقابت بر سر سود سپرده‌ها در میان بانک‌ها تشدید شد، مسئله ریزش مشتری خیلی

جدی شد. برای بانک‌هایی که ریزش داشتند این مسئله مهم بود که تشخیص بدهند چه مشتریانی در حال رفتن از بانک هستند یا در آینده به‌آرامی از بانک مهاجرت خواهند کرد. در یکی از بانک‌ها که ما این مسئله را بررسی می‌کردیم هیئت‌مدیره درخواست داشت به‌سرعت معلوم شود که چه مشتریانی در حال حاضر در حال بیرون رفتن از بانک هستند. عرض من این است که گاهی یک اتفاق خاص بازه بررسی را ممکن است خیلی کوتاه کند و فرصت ارزیابی یک هفته یا ۱۰ روز باشد.

با تنوع داده‌ها، رفتارهای مختلف و دلایلی متفاوتی روبه‌رو هستیم که ممکن است مشتری بانک را ترک کند. معمولاً عدم رضایت هم به‌آرامی شکل می‌گیرد. در تجارت داریم که هزینه جذب مشتری شش برابر نگهداری مشتری است وقتی بتوان از خروج مشتری جلوگیری کرد، بنابراین چندین برابر به نفع بانک است. این کاری است که کلان‌داده می‌تواند کمک کند تا گروه‌های مختلف مشتریان را شناسایی کند تا برحسب هرکدام پیشنهادهای مشخص و متناسب با آنها ارائه شود و از رفتن مشتری جلوگیری بشود.

شخصی‌سازی خدمات
دکتر خندان: این موضوع که پیشنهادهای شخصی (customized offers) به مشتری ارائه شود یک کاربرد خیلی جدی در مبحث کلان‌داده است. این مسئله به نظر من یکی از انقلاب‌هایی است که کلان‌داده با خود می‌آورد. لذا کلان‌داده یک تغییر پارادایم در تکنولوژی است که تغییر ماهوی در نحوه بهره‌برداری از اطلاعات ایجاد می‌کند و نمی‌توان آن را با هوش تجاری مقایسه کرد.

در صنعت خودرو ما در چند مقطع با تغییر پارادایم روبه‌رو بودیم که یکی تولید انبوه توسط فورد، دیگری تولید خودروهای کم‌مصرف در دهه ۱۹۷۰ و آخری شخصی‌سازی است که از سال‌های ۱۹۹۰ به بعد پیش آمد که از آن به (mass customization) یاد می‌شود. با ظهور اینترنت و دسترسی مستقیم به تولیدکننده، مشتری می‌توانست خودرویی را سفارش بدهد که رنگ، تجهیزات فنی و بسیاری از بخش‌های آن به انتخاب خودش باشد. این مسئله خط تولید خودرو را مشخص می‌کند یعنی از روی اطلاعات مشتریان برنامه‌ریزی تولید انجام می‌شود.

امروز با مبحث کلان‌داده این اتفاق در صنعت IT در حال رخ دادن هست؛ یعنی می‌توان شرکتی مثل گوگل یا فیس‌بوک بود و براساس رفتار و نیازهای مشتری، مشتری به مشتری، پیشنهادهای متفاوتی ارائه کرد نه حتی منطقه‌ای بلکه فردبه‌فرد و این چیزی است که امروزه باعث تغییر پارادایم در حوزه کسب‌وکار فناوری اطلاعات شده است، هرچند که در زمینه فناوری ممکن است تغییر پارادایم نباشد.

همین الان برای بانک‌ها می‌توان بدون نیاز به تغییر قوانین و هیچ بار اضافی حقوقی، مکانیزم وام‌های خرد را برای مشتریان راه انداخت به‌این‌ترتیب که مشتریان را براساس اطلاعات قبل و براساس مکانیزم‌های کلان‌داده می‌توان بخش‌بندی کرد، الگوهای رفتاری را مشخص کرد و مثلاً مشتریان را می‌توان به ۲۰۰ کلاس اعتباری تقسیم کرد که هرکدام از کلاس‌ها یک رفتاری دارند و به ازای هرکدام یک وجه مشخصه (pattern signature) مشخص کرد مثلاً معلمین، پزشکان، وکلا و طبقه‌بندی‌های دیگری که می‌توان انجام داد. بعد بر مبنای این تقسیم‌بندی به سهولت می‌توان نیازهای خرد تسهیلاتی را بدون نیاز به فرایند طولانی ارائه درخواست و آوردن ضامن و ... برطرف کرد.

اگر بتوان این طبقه‌بندی را انجام داد، فرآیند کلاً عوض می‌شود. برای یک مشتری ممکن است نیاز به هیچ‌گونه عملیاتی نباشد و به‌محض تمام شدن پول فرد، خود بانک پیشنهاد بدهد. قطعاً پیشنهادی که این‌گونه داده می‌شود به چیزی که مشتری نیاز دارد خیلی نزدیک‌تر است و احتمال خریدن این پیشنهاد بسیار بالاتر خواهد بود و این می‌تواند یک چیز جدیدی را به صنعت بانکداری ما اضافه کند. ما در حال حاضر در مقایسه با بانک‌های مطرح دنیا مثل HSBC خدمت خاصی به مشتریان نمی‌دهیم. کلان‌داده می‌تواند با تمام محدودیت‌های بانکی ما، سرویس را برای بانک‌های ایرانی به ارمغان بیاورد و نحوه تفکر و رویکرد به کسب‌وکار را عوض کند.

نصیری: این بحث خیلی جدی است که رفتار هر مشتری با مشتری دیگر متفاوت است. بحث شخصی‌سازی خدمات موضوع روز است که از سال‌های گذشته در کنفرانس KDD به‌عنوان معتبرترین کنفرانس داده‌کاوی موضوع مسابقه بوده است.

حتی رفتار فرد هم در مقاطع مختلف متفاوت است. لذا با آنالیز می‌توان خدمات متفاوتی را پیشنهاد کرد. خروجی این مباحث را می‌توان با هوش تجاری ترکیب کرد و مکمل هم تحلیل انجام داد.

تغییر پارادایم
دکتر بیات: به تغییر پارادایم اشاره شد. مناسب است در این خصوص بیشتر صحبت کنیم، برای اینکه مخاطبان بانکی ما آمادگی فکری و عملی لازم را برای تغییر در خود فراهم کنند.‌ چون تغییر پارادایم یک تغییر عمده است که می‌تواند چالش‌هایی را ایجاد کند.

دکتر سوهان‌گیر: تغییر پارادایم را از دو دید می‌توان نگاه کرد: کاربران و مدیران. برای کاربران نسل اول اینترنت، وب‌سایت‌ها همه شبیه هم بود اما الان دیگر این‌طور نیست و امروزه کار به جایی رسیده است که گوگل آنچه را که به افراد ارائه می‌کند، فردبه‌فرد متفاوت است و این باعث می‌شود تجربه افراد متفاوت باشد. این کار یک حسن و خوبی دارد و یک بدی. بدی این است که گوگل است که تعیین می‌کند که چه کسی چه چیزی ببیند. این شخصی‌سازی باعث می‌شود که هم آدم‌ها درکشان از اینترنت و محیط متفاوت باشد هم درک شرکت‌ها از آدم‌ها، تک‌تک تغییر کند. این مسئله به‌عنوان یک نکته مثبت می‌تواند باعث شود رفتار بانک با اشخاص دچار تغییر شود؛ بنابراین افراد از لحاظ اجتماعی هم مسئولیت‌پذیرتر می‌َشوند وسعی می‌کنند رفتارشان را کنترل کنند، به این خاطر که رفتار بد فرد منعکس می‌شود و نتیجه‌اش را خواهد دید، درصورتی‌که در گذشته شخص برای عبور از چراغ قرمز واهمه‌ای نداشت.

این تغییر را در محیط آنلاین هم داریم. با افراد به نسبت رفتارشان، به نسبت به اینکه فرد در چه فضایی است و چه‌کار می‌کند، می‌توان برخورد متفاوت کرد. ازاین‌جهت واقعاً تغییر پارادایم است و دیگر آدم‌ها را یک‌جور نگاه نمی‌کنیم.

در اقتصاد مبحثی به نام تبعیض قیمت وجود دارد. گرچه به لحاظ فرهنگی ممکن است این مسئله موردقبول نباشد ولی از لحاظ اقتصادی یک بهینه یابی است و از هرکس باید متناسب با مقداری که می‌تواند خرج کند، پول گرفت. حتی در این سطح کلان هم، کلان‌داده می‌تواند به کارایی و بهره‌وری یک اقتصاد کمک کند.

دکتر علی‌اکبری: این تغییر پارادایم یک چیز قطعی است. کاربران سیستم‌های جدید، جور دیگری از سیستم‌ها استفاده می‌کنند و آنچه می‌بینند متفاوت از گذشته است. ولی از پشت‌صحنه‌ها هم نباید غافل شویم. در وضعیت جدید مدیران پشت سیستم‌ها هم سیستم‌های خود را به گونه دیگری مدیریت می‌کنند؛ یعنی این تغییر را در آنجا هم می‌توان دید. مباحث BI و DSS در آنجا پررنگ می‌شود و تکنولوژی هوش تجاری به آنها خیلی خیلی کمک می‌کند و مدیران هم گزارش‌های دیگری می‌خواهند، به گونه دیگری تحلیل می‌کنند و چون داده‌ها زیاد است روش‌های جدیدی لازم دارند و برای این موضوع ممکن است هزینه‌های زیادی هم انجام دهند. گفته می‌شود در انتخابات ریاست جمهوری قبلی آمریکا باراک اوباما یک تیم کلان‌داده داشته است که توییتر را آنالیز کردند فقط برای رصد اخبار و توییت‌ها برای اینکه بفهمند روند به چه سمتی است و بهتر است در سخنرانی بعدی روی چه موضوعاتی تمرکز کند. این مثال خیلی به کاربران ارتباطی ندارد و از یک سیستم تصمیم‌گیری استفاده شده است که کوچک‌ترین تغییر در آن می‌تواند نتیجه زیادی داشته باشد. این پارادایم شیفت در تکنولوژی خیلی شدید بوده است و کاربران عام و خاص آن را احساس می‌کنند.

کسب‌وکار و چالش‌ها
دکتر بیات: اگر ممکن است به الزامات و چالش‌های استفاده از کلان‌داده هم بپردازیم. این کار چه زیرساخت‌هایی لازم دارد و با چه موانعی به خصوص در کشور ممکن است روبه‌رو شود؟

دکتر سوهان‌گیر: اینکه چگونه می‌توان مباحث کلان‌داده را به یک کسب‌وکار تبدیل کرد، سؤال مهمی است. باتوجه به اینکه من در فضای سیلیکون ولی واستنفورد بودم حس کلی من این است که در آنجا هر تکنولوژی جدید که می‌آید، آن‌قدر حرفه‌ای با آن برخورد می‌کنند که جان می‌گیرد و تبدیل به یک کسب‌وکار می‌شود. مثلاً اگر قرار بود بحث کلان‌داده را ابتدا بانک‌ها به آن نگاه کنند و به یک کسب‌وکار تبدیل کنند، خیلی متفاوت می‌َشد تا اینکه یک عده سرمایه‌گذار شرکتی درست کردند و آنها شروع به ارائه سرویس کردند. این مساله دوتا ذهینت متفاوت است. فکر نمی‌کنم کسی در این قضیه که کلان‌داده امروزه به یک ضرورت تبدیل شده است شکی داشته باشد و شاید در آینده نزدیک سازمان‌هایی که داده دارند اگر از داده‌های خود استفاده نکنند، به آن‌هایی که از داده‌هایشان استفاده می‌کنند، خواهند باخت.

در مورد الزامات هم باید بگویم، خوشبختانه اغلب نرم‌افزارهایی که برای کلان‌داده لازم است متن باز هستند و کسی که در ایران نشسته با کسی که در سانفرانسیسکو هست، تفاوتی ندارد. مهم بحث نیروی انسانی و آموزش آن است برای اینکه از نیروی انسانی آموزش دیده چگونه استفاده شود و یک چرخه‌ای درست شود که برای آن نیروی انسانی نفع داشته باشد که در این کسب‌وکار باقی بماند و شروع به کار تحلیل داده بکند وگرنه بقیه ملزومات چه سرورها و چه دیتابیس کمابیش در ایران هم وجود دارد. من فکر می‌کنم در این چرخه آن چه از همه مهم‌تر است،‌ درست کردن یک کسب‌وکار سودده است و این که چگونه نیروی انسانی تربیت کنیم که داخل این فضا بتواند به زندگی خود ادامه دهد و کار کند.

در سیلیکون ولی بحث کلان‌داده طبیعتاً باگوگل شروع شد ولی شما به هرکدام از شرکت‌های دیگر مثل فیس بوک یا توئیتر بروید، ساختار این شرکت‌ها شبیه یک کپی از روی گوگل است چون آدم‌هایی که ابتدا در گوگل بودند، بعد به توئیتر بعد به فیس بوک رفتند. خیلی از شرکت‌ها هم هستند که سرمایه‌گذاری هم در آنها صورت گرفته است ولی

به جایی نرسیده‌اند، اما آنچه در آنجا اهمیت دارد، آموزش نیروی انسانی است یعنی در این فرایندی که سرمایه‌گذاری شد، یک گروه مهندس، آموزشی دیدند و یک فرآیندی را طی کردند و حتی اگر محصول خودشان به جایی نرسید به شرکت بعدی می‌روند و درآنجا یک کار خیلی مفید انجام می‌دهند.

منظورم این است که اگر ایران یا تهران را در نظر بگیریم و اگر کلان‌داده وجود داشته باشد و شرکت‌ها شروع به آنالیز داده بکنند، ممکن است در برخی موارد نتیجه خاصی هم گرفته نشود ولی همین که روی این موضوع سرمایه‌گذاری می‌شود، متخصصانی تربیت می‌شوند که در پروژه‌های بعدی مفید خواهند بود به شرطی که زمینه فعالیت آنها را در کشور ایجاد کنیم تا بعد از مدتی از کشور مهاجرت نکنند.

مهندس شریفی حسینی: به نظر من یکی از چالش‌هایی که ما امروز داریم، همین مزیتی است که دکتر سوهان‌گیر اشاره کردند که نرم‌افزارها متن باز است و دسترسی به سرورها و دیتابیس هم وجود دارد. نتیجه نگاه این می‌شود که بانک‌ها می‌گویند خودمان کار را انجام می‌دهیم. این تصمیم منجر به این می‌شود که در چارچوب سازمانی، به دنبال جذب نیرو با فیلترهای سازمانی می‌روند، در حالی که دانش و تخصص فرد چندان مهم نیست. بعد از آن وارد فرآیند ساختمان و تعریف پروژه می‌شوند در نهایت بعد از چند سال و صرف هزینه، عملاً چیزی دست بانک را نگرفته است. به نظر من این مسئله خودش یک چالش است.

اولین کاری که ما باید بکنیم این است که به بانک‌ها بگوییم شما کار بانکداری بکنید و یک متخصص فناوری اطلاعات هم کار کلان‌داده بکند. کار بخش فناوری اطلاعات و مدیر فناوری هم نزدیک کردن برنامه‌ها با این شرکتی است که قرار است مجری باشد. می‌خواهم تاکید کنم که این‌گونه پروژه‌ها اگر برون‌سپاری نشود، انتهای آن فقط شکست است.

نصیری: من یک مثال خاص بانکی می‌زنم. بانک‌ها دیدند اگر پروژه‌ای را برون‌سپاری کنند به آن شرکت وابسته مطلق می‌شوند. برای همین منظور شرکت‌های خصوصی ثبت کردند. این مساله باعث شده است شرکت‌هایی که غیر از شرکت خود بانک هستند نتوانند در پروژه‌های بانکی وارد شوند. یک گونه رانت برای این شرکت‌ها درست شده است. کما اینکه در بانک پروژه‌ای تعریف می‌شود که شرکت‌های بیرونی زیادی وجود دارند و حاضرند کار خوبی ارائه کنند اما کار به شرکت داخلی واگذار می‌َشود و بعد از چند سال با شکست پروژه مواجه می‌شوند.

چالش دیگری که وجود دارد و سمت متخصصان فناوری اطلاعات است نه بانک،‌ این است که متخصصان این حوزه هم طبقه‌بندی شده و شناخته شده نیستند که بانک بداند کار را به چه کسی واگذار کند.

دکتر خندان: در مطلبی که فوربس راجع به مدل‌های کسب‌وکار کلان‌داده نوشته بود، به استارت‌آپ‌ها پیشنهاد کرده بود، این کار هیچ پیش‌زمینه‌ای نمی‌خواهد با داشتن مقداری زمینه داده کاوی کار را با مشاوره شروع کنید و ضمن آن تیم فنی خود را تقویت کنند و مثال‌های زیادی آورده بود که این‌گونه شرکت‌های تازه‌کار وارد حوزه کاری کلان‌داده شده بودند.

نصیری: من می‌خواهم به این مساله اشاره کنم که ما در تمام کارها یک دانش نیاز داریم و یک تجربه، فوت و فن را با هم لازم داریم. آن کسی که از دانشگاه می‌آید فقط از نظر فن قوی است و تجربه لازم را ندارد. در حوزه کلان‌داده، فوت‌های کار خیلی کلیدی و مهم هستند. ارزش تجربه در این فناوری خیلی بیشتر از حوزه‌های دیگر است.

چالش‌های داخلی
دکتر بیات: به چالش نیروی انسانی و مدیریتی در این حوزه اشاره شد. همچنین اینکه تشخیص سره و ناسره متخصصان از هم دشوار است. چه چالش‌های دیگری وجود دارد و چگونه باید با این چالش‌ها مقابله کرد؟

مهندس شریفی حسینی: یک چالش اصلی این است که متخصصان فناوری اطلاعات، مسئول کسب‌وکار بانک نیستند. لذا نیروهای بخش کسب‌وکار نیاز به آموزش جدی در این حوزه دارند که مستلزم صرف وقت و کار زیاد است که شاید سهل‌الوصول هم نباشد به این خاطر که به راحتی نمی‌توان اعضای هیأت مدیره یک بانک را سر یک کلاس نشاند. تازه بعد از متقاعد کردن آنها و پیداکردن فرصت این کار، ممکن است از نظر آنها این کار راه دور دست‌یابی به ثروت باشد و آنها موافق راه‌های کوتاه‌تری برای پول درآوردن و پیش بردن امور خود باشند. به نظر من از زمانی این اتفاق در کشور می‌تواند شکل بگیرد که شرایط اقتصادی کشور پایدار شود و کارهایی مثل خلق پول اتفاق نیافتد که خیال بانک‌ها بابت منابع جدید راحت باشد و ناچار باشند که از راه داده‌های خودشان به منفعت برسند در آن زمان است که کلان‌داده پا می‌گیرد وگرنه در حال حاضر مدیران انگیزه‌ای برای این کار ندارند.

نصیری: در نظرسنجی که دانشگاه بوستون انجام می‌دهد در مورد چالش‌های کلان‌داده، بزرگ‌ترین چالش از سال ۲۰۰۹ همیشه کیفیت داده‌ها بوده است. چالش محرمانگی همیشه جزء ۳ چالش اول بوده است و بانک تمایلی ندارد داده‌های خود را در اختیار یک نهاد بیرونی بگذارد. یک چالش دیگر ارائه این مباحث برای صاحبان کسب‌وکارها و توجیه آن‌هاست.

در جاهایی که اقتصاد پایداری دارند، پول، پول تولید نمی‌کند بلکه کار است که ارزش افزوده ایجاد می‌کند اما در ایران پول، پول تولید می‌کند لذا اگر بانک پول داشته باشد انگیزه‌ای ندارد که در این زمینه‌ها سرمایه‌گذاری کند.

دکتر سوهان‌گیر: به هرحال کار کلان‌داده کارآمد کردن تصمیم‌گیری‌هاست. حتی برای گزینه‌های واسطه‌گری مثل سرمایه‌گذاری در املاک و ... که در کشور طرفدار بیشتری دارد با استفاده از کلان‌داده می‌توان تشخیص بهتری داشت و تصمیم بهتری گرفت.

راه‌اندازی کسب‌وکار
دکتر خندان: به نظر من مسئله این نیست که ارزش افزوده‌ای که با IT می‌توان به دست آورد کمتر از سرمایه‌گذاری در سایر حوزه‌هاست بلکه این است که هیأت مدیره و مدیران تصمیم‌گیر کسب‌وکارهای ما از جمله بانکداری با این فضا چندان آشنا نیستند که چگونه می‌توانند با راه‌های خیلی سریع‌تر و مطمئن‌تر از سفته‌بازی از داده‌ها ثروت تولید کنند. تقصیر این مسئله هم متوجه آنها نیست و به متخصصان IT بر می‌گردد که باید نحوه کسب‌وکار در حوزه فناوری را یاد بدهند و با ایجاد ارزش به توسعه بازار آن کمک کنند.

مهندس شریفی حسینی: اینجاست که می‌توان گفت جای شرکت‌های بزرگ مشاوره‌ای که در دنیا هستند در کشور خالی است. مثلاً مشابه دیلویت ما در کشور نداریم. آنها هستند که IT را به صنعت نزدیک می‌کنند.

دکتر خندان: امروزه استارت‌آپ‌ها هم می‌توانند این نقش را ایفا کنند و با راه‌اندازی کسب‌وکارهای کوچک از طریق IT پول در بیاورند. ما هم ناچاریم به این سمت حرکت کنیم چون اقتصاد ما ناچار است از درآمدهای نفتی فاصله بگیرد.

دکتر علی‌اکبری: در مورد چالش‌های ایران یک نکته عرض کنم. مدل‌های کسب‌وکار کلان‌داده، دوگونه است یا برون سپاری یا درون سپاری. چه راهی می‌توان انتخاب کرد که ریسک‌های دو روش را کم کند؟ به نظر می‌رسد راه‌حل شرکت‌های مشاوره به معنای خاص مشاوره باشد. شرکت‌هایی که فقط مشورت نمی‌دهند بلکه زیرساخت در اختیار شرکت‌ها قرار می‌دهند مثل شرکت Cloudera که یک بانک لزوماً تحلیل سیستم خود را به آنها نمی‌دهد. این شرکت زیرساخت‌هایی آماده می‌کند از جنس زیرساخت‌های فنی و نیروی متخصص آموزش می‌دهد که این نیروها را می‌تواند کرایه دهد. این موضوع چیزی است که ما در ایران نداریم. این که منابع متن‌ساز هستند فرصت خیلی خوبی است ولی فرق ما با سانفرانسیسکو شاید این باشد که آنها این شرکت‌های مشاوره را دارند و اکوسیستم آنها کامل است اما در کشور همه چیز یا باید برون سیاری کامل شود یا درون سیاری و هر دوی این روش‌ها ریسک بالایی دارند، چون پروژه‌های کلان‌داده طول عمر کوتاهی ندارند ولی متاسفانه طول عمر مدیریت‌ها در کشور خیلی کوتاه‌تر از آن است که این پروژه به ثمر برسد.

یک چالش داخلی دیگر این است که مدیران عموماً به این حوزه‌ها به چشم یک محصول نگاه می‌کنند؛ یعنی دوست دارند که یک‌باره یک محصول Big Data بخرند و بعد از آن سودشان تغییر محسوس کند در حالی که این کار یک فرایند است، باید روی آن سرمایه‌گذاری شود، محصول زیرساختی ایجاد شود، فرهنگ سازمانی ایجاد شود، نیروی انسانی متخصص پرورش داده شود و این شرکت‌ها به مرور ایجاد شوند. شرکت‌هایی که کار انجام نمی‌دهند اما به انجام آن کمک می‌کنند. مسئولیت کار ممکن آ ست در بانک یا شرکت فناوری بانک بماند ولی برای زیرساخت‌ها به دنبال دانلود هادوپ و اختراع چرخ از ابتدا نباشند، از این شرکت‌ها کمک بگیرند و زیرساخت بخرند نه محصول. البته در ایران یک فرصت هم وجود دارد که ممکن است خارج از ایران نباشد. اقتصاد کشور اقتصاد بسته‌ای است و مخصوصاً از بعد امکانات سخت‌افزاری قدرت مانور ما به اندازه گوگل و فیس‌بوک نیست. در کشور هنوز مدیران بانکی به دنبال خرید سخت‌افزارهای متمرکز گران‌قیمت هستند. با این که اقتصاد در مضیقه است اما همه می‌خواهند z۱۰ آی بی‌ام را بخرند در حالی که کلان‌داده می‌تواند با قیمت‌های خیلی کمتر داده‌ها را روی سرورهای خیلی ارزان‌تر توزیع و پردازش کند و هزینه‌ها را کاهش دهد. حال که به دلیل تحریم‌ها نمی‌توان z۱۰ خرید، به جای آن ۱۰۰ سرور ارزان قیمت بخریم. البته این کار زمان می‌خواهد و این گونه نیست که امروز محصول بخریم مثل تجربه ایران خودرو که محصول SAP خرید ولی به دلیل آماده نبودن سازمان و فرهنگ سازمانی به موفقیت نرسید. باید متخصصان فناوری اطلاعات و کسب‌وکارها در کنار هم قرار بگیرند و به یک فهم مشترک برسند.

مطلب خوبی بود و ما هم خیلی دنبال این بودیم که اخبار بیگ دیتا را مقل چهار موضوع برتر دیگر سال 2015 منتشر کنیم و کمی سایت های خبری از اخبار روزمره فاصله بگیرند. خیلی به وجد آمدیم وقتی گزارش شما را خواندیم . خوشحال هستیم که جمع هایی هستند برای اطلاع رسانی های حرفه ای تر. امیدواریم بیشتر بتوانیم باشما همراه باشیم.