h.jabbari
15th December 2012, 05:38 PM
آنچه امروز بهنام «داده بزرگ» خوانده میشود روزی بهسادگی «داده» نامیده خواهد شد. داده بزرگ یک نیاز آنی نیست، بلکه در واقع مرحله جدیدی در تحولات مدیریت دادههاست. داده بزرگ روشی برای تعریف رشد تصاعدی دادههاست که همه در تلاشند با آن سازگار شوند و راهی است برای برجسته ساختن فرصتهای جدید در جهت استخراج معنا از آن دادهها با استفاده از فناوری نوپدید.
داده بزرگ چند تعریف مختلف دارد. در این بحث، شرکت گارتنر (Gartner) بهدرستی داده بزرگ را به این عنوان تعریف میکند که: “داراییهای اطلاعاتی با حجم بالا، شتاب بالا، و یا تنوع بالا که نیازمند اشکال جدید پردازشی است که تصمیمگیری پیشرفته، کشف بینش و بهینهسازی فرایند را امکانپذیر سازد.” داده بزرگ با استفاده از فناوری جدید به چالشهای حجمهای عظیم داده، پردازش چابکانه مجموعههای بسیار بزرگ دادهها و یا مدیریت مجازی انواع گوناگون دادهها پاسخ میدهد.
چرا داده بزرگ در این زمان خاص سر براورده است؟ ریشه اصلی در شبکه گسترده جهانی است. در شبکه جهانی دیگر تنها با هزاران بهرهبردار نرمافزار کاربردی سرویسدهنده/ سرویسگیرنده که از سیستمهای مدیریت پایگاه داده رابطهای (RDBMS) نیرو میگیرند، سروکار نداریم. نرمافزارهای کاربردی مبتنی بر شبکه جهانی آزادانه در دسترس همه سرویسگیرندگان در سراسر جهان قرار دارد. میلیونها بهرهبردار بهطور همزمان از طریق کنش با نرمافزارهای کاربردی، داده ایجاد میکنند.
چنین سطحی از فعالیت نیازمند سیستمهای بسیار تنظیمپذیر است تا بهرهبرداران بتوانند کار خود را انجام دهند و آغازی است برای جنبش سیستمهای مدیریت پایگاه داده گسترده (NoSQL) که مستلزم تحلیل مجموعه دادههای بسیار گسترده و نیمهسازمند است تا حساب کند که چگونه میتوان تجربه بهرهبردار را بهینه و رفتار را اقتصادی ساخت. این رویکرد زمینه را برای آغاز چارچوبهای نرمافزاری منبع باز و تحول پایگاه دادههای تحلیلی به کمک پردازش موازی انبوه (MPP) و مجموعه جدید ابزار هوشمندی تجاری (BI) فراهم ساخت.
در همین زمان، نرخ رشد دادهها به افزایش خود ادامه میدهد. امروزه، دادههای صفحات مشاهدهشده در اینترنت، رویدادهای سیستم، و دیگر منابع وابسته به فناوریِ محوری که ما به آنها اتکا داریم، بیشتر دادههای جدید و نیمهسازمند را که سوخت پردازش دادههای بزرگ را فراهم میسازند، تامین میکنند. در آینده، دستگاههای همراه و شناسه اینترنتی اشیا (IOT) که از طریق شناسه فرکانس رادیویی (RFID) و دیگر حسابگرها، به ما امکان میدهند امواج عظیم دادههای جدید را از سیستمهای تولیدی، زیرساختهای حملونقل، تجهیزات طبی و هرگونه داستان از یک صنعت خاص را که میتوان تصور کرد، جمعآوری و تحلیل کنیم.
بنابراین ارزش دارد که از نزدیک اولین نرمافزارهای کاربردی مبتنی بر دادههای بزرگ را بهتدریج که پدیدار میشوند، زیر نظر بگیریم. فناوریهای نوپدید که امروز با دادههای بزرگ همراه میشوند بهعنوان محصولات استاندارد مدیریت دادهها برای عهدهدار شدن انفجار آینده دادهها قلمداد خواهند شد.
داده بزرگ چند تعریف مختلف دارد. در این بحث، شرکت گارتنر (Gartner) بهدرستی داده بزرگ را به این عنوان تعریف میکند که: “داراییهای اطلاعاتی با حجم بالا، شتاب بالا، و یا تنوع بالا که نیازمند اشکال جدید پردازشی است که تصمیمگیری پیشرفته، کشف بینش و بهینهسازی فرایند را امکانپذیر سازد.” داده بزرگ با استفاده از فناوری جدید به چالشهای حجمهای عظیم داده، پردازش چابکانه مجموعههای بسیار بزرگ دادهها و یا مدیریت مجازی انواع گوناگون دادهها پاسخ میدهد.
چرا داده بزرگ در این زمان خاص سر براورده است؟ ریشه اصلی در شبکه گسترده جهانی است. در شبکه جهانی دیگر تنها با هزاران بهرهبردار نرمافزار کاربردی سرویسدهنده/ سرویسگیرنده که از سیستمهای مدیریت پایگاه داده رابطهای (RDBMS) نیرو میگیرند، سروکار نداریم. نرمافزارهای کاربردی مبتنی بر شبکه جهانی آزادانه در دسترس همه سرویسگیرندگان در سراسر جهان قرار دارد. میلیونها بهرهبردار بهطور همزمان از طریق کنش با نرمافزارهای کاربردی، داده ایجاد میکنند.
چنین سطحی از فعالیت نیازمند سیستمهای بسیار تنظیمپذیر است تا بهرهبرداران بتوانند کار خود را انجام دهند و آغازی است برای جنبش سیستمهای مدیریت پایگاه داده گسترده (NoSQL) که مستلزم تحلیل مجموعه دادههای بسیار گسترده و نیمهسازمند است تا حساب کند که چگونه میتوان تجربه بهرهبردار را بهینه و رفتار را اقتصادی ساخت. این رویکرد زمینه را برای آغاز چارچوبهای نرمافزاری منبع باز و تحول پایگاه دادههای تحلیلی به کمک پردازش موازی انبوه (MPP) و مجموعه جدید ابزار هوشمندی تجاری (BI) فراهم ساخت.
در همین زمان، نرخ رشد دادهها به افزایش خود ادامه میدهد. امروزه، دادههای صفحات مشاهدهشده در اینترنت، رویدادهای سیستم، و دیگر منابع وابسته به فناوریِ محوری که ما به آنها اتکا داریم، بیشتر دادههای جدید و نیمهسازمند را که سوخت پردازش دادههای بزرگ را فراهم میسازند، تامین میکنند. در آینده، دستگاههای همراه و شناسه اینترنتی اشیا (IOT) که از طریق شناسه فرکانس رادیویی (RFID) و دیگر حسابگرها، به ما امکان میدهند امواج عظیم دادههای جدید را از سیستمهای تولیدی، زیرساختهای حملونقل، تجهیزات طبی و هرگونه داستان از یک صنعت خاص را که میتوان تصور کرد، جمعآوری و تحلیل کنیم.
بنابراین ارزش دارد که از نزدیک اولین نرمافزارهای کاربردی مبتنی بر دادههای بزرگ را بهتدریج که پدیدار میشوند، زیر نظر بگیریم. فناوریهای نوپدید که امروز با دادههای بزرگ همراه میشوند بهعنوان محصولات استاندارد مدیریت دادهها برای عهدهدار شدن انفجار آینده دادهها قلمداد خواهند شد.