روندهای نوین فناوریها و توسعه سریع نرمافزارهای جدید منجر به تولید جزایر دادهای آشفته و پیچیده در سازمانها شده است که خود باعث افت کیفیت داده و هزینه بالای بهاشتراکگذاری داده شده است. ضرورت تبادل داده در مقیاس بینسیستمی یا بینسازمانی خود انبوهی از چالشها و نیازمندیها را در سطوح فنی-قانونی و کسبوکاری به همراه آورده است؛ همچنین مسایل مربوط به حریم خصوصی، سطوح دسترسی و ریسکهای امنیتی نیز همگی اهمیت ساماندهی به «معماری داده» را بیشاز پیش ضروری ساخته است.
در حالیکه تعاریف قدیمی از داده بر مفهوم بازنمایی واقعیتهای جهان تکیه داشته، در ادبیات چند دهه اخیر داده به معنای اطلاعاتی که در فرمت دیجیتال ذخیره میشود، درنظر گرفته شده است (اگرچه لزومی ندارد هر دادهای در فرمت دیجیتال ثبت و ذخیره شود). طبعتا امروزه بهدلیل قابلیتهای فناوری برای ثبت و ذخیره انبوهی از چیزها بهصورت الکترونیکی، به بسیاری چیزها “داده” میگوییم – مانند اسامی، آدرسها، تاریخها، … – در حالیکه چند دهه قبل به این چیزها عنوان داده اطلاق نمیشد. در تعاریف رسمی، داده را “ماده خام اطلاعات” و اطلاعات را “داده دارای زمینه” مینامند.
دارایی (Asset)، یک منبع اقتصادی است که قابلیت مالکیت یا کنترل داشته و ارزش تولید میکند و قابل تبدیل به “پول” است. داده در عصر جدید به عنوان یک دارایی سازمانی به رسمیت شناخته شده اگرچه هنوز نحوه مدیریت بر این دارایی ارزشمند نوین، کاملا شفاف و استاندارد نشده است. در ادبیات معماری سازمانی، داده یک دارایی مهم ولی ناملموس (Intangible) سازمانی است که در فرایندها و سیستمها پردازش شده و منجر به خلق ارزش-سرویس میشود. چارچوب زکمن به عنوان اولین چارچوب شناختهشده معماری، ستون “چهچیز” یا “اشیاء کسبوکار” را مختص به داده در نظر گرفته بود. بعدها در چارچوبهای دیگر مانند فدرال، توگف، وزارت دفاع و غیره نیز یک لایه مستقل و مهم برای داده-اطلاعات درنظر گرفته شد. در چارچوب ملی معماری سازمانی ایران (IEAF) نیز یکی از دامنههای اصلی به داده و اطلاعات تخصیص پیدا کرده است
اگرچه معماری داده و مباحث آن، چارچوبی مستقل از معماری سازمانی نیست و تقریبا در همه چارچوبهای معماری سازمانی به داده و اطلاعات بهصورت یک دامنه (لایه) مهم توجه شده، آنچه نیازمند توجه جدی است رشد نمایی کاربردها و ابزارهای لایه داده طی چند سال اخیر است بطوریکه اهمیت این لایه معماری سازمانی را بهعنوان یک لایه اولویتدار که باید برای آن سریعا معماری و نظام مدیریت منسجم دیده شود، تقویت کرده است. فناوری و راهکارهایی مانند انباره داده (Data Warehouse)، دریاچه داده (Data Lake)، کلان داده(Big Data) ، داده باز (Open Data)، مدیریت دادههای کلیدی (MDM)، سرویسهای داده (Data Services)، هوش تجاری (Business Intelligence)، جریان داده (Data Streaming) و نظایر اینها، تنها نمونههایی از مصادیق رشد کاربردهای این لایه است.
در عصر دیجیتال، اهمیت لایه داده تا آنجاست که براساس براوردها، حجم دادههای الکترونیکی (دیجیتال) در جهان تا سال 2025 به 175 زتابایت (هر زتابایت معادل 10 به توان 21 بایت است) خواهد رسید. براساس تحقیق موسسه DATAVERSITY، بیش از 80 درصد از عملیات داده در سازمانها “کاملا خودکار” یا “نیمه خودکار” شده است و بیش از 67 درصد سازمانها، بهدرجاتی نظامهای مرتبط با حاکمیت داده را پیادهسازی کردهاند. برخی متخصصان براورد کردهاند که سازمانها حدود 10 تا 30 درصد از درامد خود را صرف مدیریت داده میکنند، IBM تخمین زده است که هرسال حدود 31000 میلیارد دلار هزینه صرف کیفیت پایین دادهها در جهان می شود.
معماری داده و DMBOK
حوزههای دانشی مرتبط با حاکمیت داده طیف وسیعی از موضوعات و تکنیکها را دربرمیگیرد، در آخرین نسخه پیکره دانش مدیریت داده (DMBOK)، 10 حوزه دانشی به اضافه حاکمیت داده در مرکز چرخ داما مطابق با شکل زیر سازماندهی شده است که دربردارنده مجموعه دانش و تکنیکهای لازم برای مدیریت موثر داده است. “معماری داده” اگرچه یکی از این حوزه های ده گانه است اما نقش کلیدی در جهت دهی عناصر دیگر دارد.
در ادامه توضیح مختصری درباره هرکدام از این حوزهها ارایه میشود:
- «معماری داده» درباره فهم جامعنگر و بنیادین از وضعیت ایستا و پویای موجودیتهای دادهای سازمان و روابط و استانداردهای حاکم بر آن است که شامل نقشههای طراحی، مدلهای مرجع، استانداردها، قالبها و برنامه تحقق وضعیت مطلوب میشود.
- «طراحی و مدلسازی داده» درباره ساختاردهی و بازنمایی گرافیکی موجودیتهای دادهای در زمینه و محدوده مورد نظر است.
- «ثبت و عملیات داده» درباره مدیریت طراحی پایگاه داده، روشهای پیادهسازی و پشتیبانی در راستای وظایف محوله و حفاظت از ارزش داده است.
- «امنیت داده» شامل همه نظامها و اقدامات لازم برای تامین امنیت تایید هویت، مجوزدهی و دسترسی به دادهها است اعم از اقدامات پیشگیرانه، ممیزی و تخفیف اثر ریسک.
- «تعاملپذیری و یکپارچگی داده»، دربردارنده نظامها و اقدامات لازم برای انتقال، تجمیع و تبدیل داده است که درجهت جابجایی داده از یک زمینه به زمینه دیگر لازم میشود.
- «دادههای مرجع و اصلی (Master)» درباره مدیریت دادههای اصلی (بحرانی) است برای اطمینان از دسترسپذیری، دقت، امنیت، قابلیت اعتماد.
- «مدیریت مستندات و محتوا» درباره فرایند مدیریت دادههای غیرساختیافته – از ایجاد و ذخیرهسازی تا جستجو و آرشیو– است.
- «مدیریت فراداده» شامل همه اقدامات لازم برای مدیریت اطلاعات درباره دادهها است. فراداده زمینهساز فهم و استفاده مناسب داده، قابلیت یکپارچگی و امنیت داده است.
- «کیفیت داده» شامل همه اقدامات برای مدیریت کیفیت داده است بطوریکه اطمینان حاصل شود داده قابل استفاده است.
- «انبارهداده، هوش تجاری» شامل همه اقدامات لازم برای فراهمسازی بینش کسبوکاری و پشتیبانی تصمیمگیری است.