Okuyucuların Seçimi
Popüler Makaleler
Öğrenciler, yüksek lisans öğrencileri, bilgi tabanını çalışmalarında ve çalışmalarında kullanan genç bilim adamları size çok minnettar olacaktır.
Yayınlanan http://www.allbest.ru/
1.1 İlişkisel veri modeli. Temel tanımlar
Matematik disiplinlerinde "tablo" kavramı, "ilişki" (ilişki) kavramına karşılık gelir. Tablo, gerçek dünya nesnesini - varlığı yansıtır ve satırlarının her biri varlığın belirli bir örneğini yansıtır. Her sütunun tablo için benzersiz bir adı vardır. Dizelerin adları yoktur, sıraları tanımlanmamıştır ve sayıları mantıksal olarak sınırlandırılmamıştır. İlişkisel veri modelinin ana avantajlarından biri homojenliktir (bir tablonun her satırının bir formatı vardır). Kullanıcı, ilgili varlıkların homojenliğine sahip olup olmadığına kendisi karar verir. Bu, model uygunluğu sorununu çözer.
Temel konseptler:
* İlişki, bazı verileri içeren iki boyutlu bir tablodur.
* Varlık - verileri veritabanında depolanan herhangi bir nitelikteki bir nesne. Nitelikler - varlığı karakterize eden özellikler (sütunlar).
* İlişki derecesi - sütun sayısı.
* İlişki şeması - öznitelik adlarının bir listesi, örneğin, ÇALIŞAN (No., Tam Ad, Doğum Yılı, Pozisyon, Departman).
* Etki alanı - bir dizi ilişki özniteliği değeri (veri türü).
* Tuple - tablo satırı.
* Kardinalite (güç) - tablodaki satır sayısı.
* Birincil anahtar, bir ilişkideki satırları benzersiz şekilde tanımlayan bir niteliktir. Birden çok özniteliği olan birincil anahtara bileşik anahtar denir. Birincil anahtar tamamen veya kısmen boş olamaz (boş değere sahip). Birincil anahtar olarak kullanılabilen anahtarlara aday veya alternatif anahtarlar denir.
* Yabancı anahtar, bir tablonun, başka bir tablonun birincil anahtarı olarak hizmet edebilen öznitelik(ler)idir. Başka bir tablonun birincil anahtarına başvurudur.
Normalleştirme, bir veritabanındaki bilgi fazlalığını azaltmayı amaçlayan bir süreçtir. Verilerin kendisine ek olarak, veritabanında çeşitli adlar, nesne adları ve ifadeler de normalleştirilebilir.
Normalleştirilmemiş bir veritabanı, bir veya daha fazla farklı tabloda bilgi içerir; bu, belirli bir tabloya verilerin dahil edilmesinin herhangi bir belirgin nedenden kaynaklanmadığı izlenimini yaratır. Bu durumun veri güvenliği, disk alanı yönetimi, sorgu hızı, veritabanı güncelleme verimliliği ve belki de en önemlisi depolanan bilgilerin bütünlüğü üzerinde olumsuz bir etkisi olabilir. Normalleştirmeden önceki veritabanı, mantıksal olarak daha yönetilebilir daha küçük tablolara henüz bölünmemiş bir yapıdır.
Normal form, veritabanı normalleştirme düzeyinin veya derinliğinin bir tür göstergesidir. Bir veritabanının normalizasyon düzeyi, içinde bulunduğu normal forma karşılık gelir.
1.2 İlişkilerle ilgili işlemler
Bir tabloyu ilk normal forma (1NF) dönüştürmek için iki kurala uyulmalıdır:
1. Atomiklik veya bölünmezlik. Her sütun bir bölünemez değer içermelidir.
2. Tablo, tekrar eden sütunlar veya veri grupları içermemelidir.
Örneğin bir tablo bir alanda bir kişinin tam adresini (cadde, şehir, posta kodu) içeriyorsa, bir sütunda farklı değerler içereceğinden 1NF kurallarına uymayacaktır. atomite kuralının ihlali. Veya veritabanı filmlerle ilgili verileri içeriyorsa ve aktör1, aktör2, aktör3 sütunlarına sahipse, veri tekrarı olacağı için kurallara da uymayacaktır.
Normalleştirme, 1NF ile uyumluluk için veritabanı yapısının kontrol edilmesiyle başlamalıdır. Atomik olmayan tüm sütunlar, kurucu sütunlarına bölünmelidir. Tabloda yinelenen sütunlar varsa, ayrı bir tablo ayırmaları gerekir.
Bir tabloyu ilk normal forma dönüştürmek için:
* Birden fazla bilgi içeren tüm alanları bulun.
* Bileşen parçalarına ayrılabilen veriler ayrı alanlara yerleştirilmelidir.
* Yinelenen verileri ayrı bir tabloya taşıyın.
* Tüm tabloların ilk normal formun koşullarına uyup uymadığını kontrol edin.
Tabloları ikinci normal forma (2NF) dönüştürmek için, elde edilen tabloların zaten 1NF'de olması gerekir. Normalleştirme sırayla yapılmalıdır.
Şimdi, ikinci normal formda, koşulun karşılanması gerekir - anahtar olmayan herhangi bir sütun (yabancı olanlar dahil) birincil anahtara bağlı olmalıdır. Tipik olarak, anahtara bağlı olmayan değerlere sahip olan bu sütunların tanımlanması kolaydır. Bir sütunda yer alan veriler, satırı tanımlayan anahtarla ilgili değilse, kendi ayrı tablolarına ayrılmalıdır. Birincil anahtar eski tabloya döndürülmelidir.
Tabanı ikinci normal forma dönüştürmek için:
* Bu tablonun birincil anahtarına doğrudan bağımlı olmayan tüm sütunları tanımlayın.
* Kullanıcılar ve forum tablolarında gerekli alanları oluşturun, mevcut alanlardan seçim yapın veya yenilerinden birincil anahtarlar oluşturun.
* Her tablonun kendi birincil anahtarına ihtiyacı vardır
* Yabancı anahtarlar oluşturun ve tablolar arasındaki ilişkileri belirtin. 2NF'ye normalleştirmenin son adımı, ilişkili tablolarla ilişkilendirme için yabancı anahtarların tahsis edilmesi olacaktır. Bir tablonun birincil anahtarı, başka bir tablonun yabancı anahtarı olmalıdır.
İpuçları:
2NF şeması oluşturmanın başka bir yolu da tablolar arasındaki ilişkilere bakmaktır. İdeal seçenek, tüm bire çok ilişkileri oluşturmaktır. Çoktan çoğa ilişkilerin yeniden yapılandırılması gerekir.
Düzgün bir şekilde normalleştirilmiş bir tabloda asla yinelenen satırlar olmaz (değerleri anahtar olmayan ve aynı verileri içeren iki veya daha fazla satır).
Bir veritabanı, ikinci normal forma dönüştürülürse ve anahtar olmayan her sütun birbirinden bağımsızsa, üçüncü normal formda olacaktır. Bu noktaya kadar normalleşme süreci doğru takip edilirse 3NF'ye indirgemede herhangi bir sorun olmayabilir. Bir sütundaki değerde bir değişiklik, başka bir sütunda bir değişiklik gerektiriyorsa, 3NF'nin ihlal edildiğini bilmelisiniz.
Tabanı üçüncü normal forma dönüştürmek için:
* Hangi tabloların hangi alanlarında karşılıklı bağımlılık olduğunu belirleyin, yani. Bir bütün olarak seriden daha fazla birbirine bağlı alanlar.
* İlgili tablolar oluşturun. 1. adımda sorunlu bir sütun varsa, bunun için ayrı tablolar oluşturun.
* Birincil anahtarlar oluşturun veya tahsis edin. Her tablonun bir birincil anahtarı olmalıdır.
* İlişkilerden herhangi birini oluşturan gerekli yabancı anahtarları oluşturun.
Dördüncü normal formda, ek bir kural, çok değerli bağımlılıkları hariç tutmaktır. Diğer bir deyişle, tüm tablo satırları birbirinden bağımsız olmalıdır. Bazı X satırının varlığı, Y satırının da bu tabloda bir yerde olduğu anlamına gelmemelidir.
3. Sistemin yapısı - sistemin temel özelliklerini belirleyen sistem öğelerinin etkileşiminin bileşimi, sırası ve ilkeleri. Sistemin tek tek öğeleri farklı düzeylerde birbirinden ayrılmışsa ve öğeler arasındaki iç bağlantılar yalnızca üst düzeylerden alt düzeylere doğru organize edilmişse ve bunun tersi de, sistemin hiyerarşik bir yapısından söz ederler. Tamamen hiyerarşik yapılar pratikte nadirdir, bu nedenle bu kavramı biraz genişleterek, hiyerarşik bir yapının genellikle diğer bağlantıların yanı sıra hiyerarşik bağlantıların çok önemli olduğu bu tür yapılar anlamına geldiği anlaşılır.
Otomatik bilgi sistemi (AIS), muhasebe ve analitik bilgilerin işlenmesini otomatikleştirmek için tasarlanmış uzmanların yanı sıra çeşitli destek türlerinin bir kombinasyonudur. Kompozisyon açısından destek türleri, kural olarak, farklı sistemler için homojendir ve bu, sistemlerin çalışması sırasında uyumluluk ilkesinin uygulanmasını mümkün kılar. AIS'yi karmaşık bir sistem olarak inceleme sürecinde, bireysel parçaları ve elemanları ayırmak ve kullanımlarının özelliklerini oluşturma ve çalıştırma aşamalarında dikkate almak gerekir.
Kurumsal bilgi sistemleri, çalışma grupları için sistemlerin bir evrimidir, büyük şirketlere odaklanırlar ve coğrafi olarak dağınık düğümleri veya ağları destekleyebilirler. Temel olarak, birkaç seviyeden oluşan hiyerarşik bir yapıya sahiptirler. Bu tür sistemler, sunucuların uzmanlaşması veya çok seviyeli bir mimari ile bir istemci-sunucu mimarisi ile karakterize edilir. Bu tür sistemler geliştirilirken, grup bilgi sistemleri geliştirilirken kullanılan aynı veritabanı sunucuları kullanılabilir. Ancak büyük bilgi sistemlerinde en yaygın olarak kullanılan sunucular Oracle, DB2 ve Microsoft SQL Server'dır.
1. Agaltsov, V.P. Veri tabanı. 2 ciltte V. 2. Dağıtılmış ve uzak veritabanları: Ders Kitabı / V.P. Agaltsov. - M.: ID FORUM, SIC INFRA-M, 2013.
2. Golitsyna, O.L. Veritabanları: Ders Kitabı / O.L. Golitsyna, N.V. Maksimov, I.I. Popov. - M.: Forum, 2012.
3. Karpova, I.P. Veritabanları: Ders Kitabı / I.P. Karpov. - St. Petersburg: Peter, 2013.
4. Kirillov, V.V. İlişkisel veritabanlarına giriş İlişkisel veritabanlarına giriş / V.V. Kirillov, G.Yu. Gromov. - St. Petersburg: BHV-Petersburg, 2012.
5. Pirogov, V.Yu. Bilgi sistemleri ve veri tabanları: organizasyon ve tasarım: Ders Kitabı / V.Yu. Pirogov. - St. Petersburg: BHV-Petersburg, 2009.
6. G.N. Fedorov. Bilgi sistemi. - M.: Akademi, 2013.
7. A.E. Satunina, L.A. Sisoev. İşletmenin kurumsal bilgi sisteminin proje yönetimi. - M.: Finans ve istatistik, Infra-M, 2009.
Allbest.ru'da barındırılıyor
...Veri modeli türlerinin özü ve özellikleri: hiyerarşik, ağ ve ilişkisel. İlişkisel veri modelinin temel kavramları. Nitelikler, veritabanı ilişki şeması. Veri bütünlüğü koşulları. Tablolar arasındaki ilişkiler. Veri modeli hakkında genel fikirler.
dönem ödevi, 29/01/2011 eklendi
Kurumsal bilgi sistemleri ve veritabanları, iş geliştirme ve hata ayıklama için kullanımları. Kurumsal bilgi sistemlerinin sınıflandırılması. OLTP sınıfının bilgi sistemleri. Operasyonel analitik işleme.
dönem ödevi, 19/01/2011 eklendi
İki boyutlu dosyalara ve ilişkisel veritabanı yönetim sistemlerine (DBMS) sahip veritabanları. Bir DBMS kullanarak bir veritabanı oluşturma ve bunlara yönelik sorguları işleme. Temel veritabanları türleri. İlişkisel veritabanlarının temel kavramları. İlişkilerin temel özellikleri.
özet, eklendi 20/12/2010
Bir veritabanı sistemi kavramı. İlişkisel model ve özellikleri. İlişkisel modelde bütünlük. İlişkisel cebir. Veritabanı tasarım sorunları. normal ilişki biçimleri. Varlık-ilişki yöntemini kullanarak bir veritabanı tasarlama. ER diyagramları. SQL dili.
dersler, eklendi 03.10.2008
Bir veritabanında depolanan verilerin belirli bir mantıksal yapısı. Temel veri modelleri. İlişkisel veri modelinin öğeleri. Yabancı anahtar kullanımına bir örnek. İlişkisel veri modelinin ilişkileri için temel gereksinimler.
sunum, eklendi 10/14/2013
Veritabanları ve bilgi işlemde kullanımları. Ağ veri modelinin özellikleri ve temel yapısal birimi. Hiyerarşik model, etki alanı nesneleri. İlişkisel model, görünürlüğü, verilerin tablo halinde sunulması.
özet, 19/12/2011 eklendi
Veritabanı yönetim sistemi Microsoft Access türleri ve işlevleri. Hiyerarşik, ağ, ilişkisel veritabanı tanımlama modeli. Bir veritabanı tablosunun temel kavramları. Veritabanı nesneleri oluşturmanın özellikleri, temel formlar. Access'te İnternet'e erişim.
kontrol çalışması, eklendi 01/08/2011
Modern veritabanı yönetim sistemleri (DBMS). Hiyerarşik veri modelinin analizi. İlişkisel veri modeli. Tablo kayıtlarında saklanan verilerin bölünmezliği kısıtlamasını ortadan kaldıran genişletilmiş bir ilişkisel model olarak ilişki sonrası veri modeli.
bilimsel çalışma, eklendi 06/08/2010
Veritabanı yönetiminde veri modelleri. Kavramsal veri modelleri. Bilgi sistemlerinde veri tabanlarının rolü. İlişkisel veri modeli. Konu alanının tanımı. "Evcil Hayvanlar" bilgi sistemi için bir veritabanı modeli oluşturma.
dönem ödevi, 19/04/2011 eklendi
Gerçek bir nesne veya sistem için basitleştirilmiş bir ikame olarak Access'te bir bilgi modeli. Verilerin organizasyonunu ve aralarındaki ilişkileri tanımlayan temel yapılar; ilişkisel veri organizasyonu türü. Vergilendirmede bir veritabanı örneği.
Görünüşe göre şimdi veri ambarlarının geliştirilmesi konusu yeni bir geliştirme döngüsüne girdi. Yeni teknolojiler, yaklaşımlar ve araçlar ortaya çıkıyor. Çalışmaları, testleri ve makul uygulamaları, gerçekten ilginç ve kullanışlı çözümler yaratmamızı sağlıyor. Ve bunları uygulamaya geçirin, geliştirmelerinizin gerçek işte kullanılmasının ve fayda sağlamanın tadını çıkarın.
İşin büyük şemasında, mimarın kim olduğu önemli değil, önemli olan birinin bu soruları sorması ve cevaplarını keşfetmesidir. Mimar açıkça seçiliyorsa, bu yalnızca sistemden ve gelişiminden öncelikli olarak onun sorumlu olduğu anlamına gelir.
Bu konuyla ilgili olarak “antifrajilite” konusu bana neden alakalı göründü?
"Kırılganlığa karşı korumanın benzersizliği, bilinmeyenle çalışmamıza, tam olarak ne yaptığımızı anlamadığımız koşullarda bir şeyler yapmamıza ve başarılı olmamıza izin vermesidir."/Nassim N.Taleb/Bu nedenle, kriz ve yüksek derecede belirsizlik, mimari eksikliğin mazereti değil, ihtiyacı güçlendiren faktörlerdir.
Etiketler: Etiketler ekle
5.1. Kurumsal bilgi sistemlerinde verilerin organizasyonu.
BDT'yi en basit düzeyde ele alırsak, kurumsal bir bilgisayar (bilgisayar) ağı ve konu alanındaki sorunları çözmek için özel bir uygulama yazılım paketi (APP) içerdiğini söyleyebiliriz. Buna karşılık, hem PPP hem de bilgisayar ağı, onlar tarafından kontrol edilen ve yönetilen sistemlerin durumu ve gelişimi hakkında bilgi verilerinin kullanımını ima eder. Tarihsel olarak, BDT, birbirine bağlı ve genellikle hiyerarşik bir sistemi temsil eden bireysel işletmelerin ayrı dallı alt sistemlerinden oluşur. Bu tür alt sistemlerin hem kendi kaynaklarına hem de ilgili verileri depolamak için kendi yerlerine sahip olduğunu varsaymak doğaldır. Tek bir sistemde birleştirildiğinde, coğrafi olarak farklı depolama yerlerinde bulunan verilerin ortak doğru kullanımı hakkında sorular ortaya çıkıyor. Bu nedenle, CIS ile donatılmış bir üretim birliğini başarılı bir şekilde yönetmek için verilerin toplanması, depolanması ve işlenmesi için güvenilir bir sisteme ihtiyacı vardır. Başka bir deyişle, stratejik BI (İş Zekası) projelerini karşılayan birleşik bir bilgi altyapısına veya verileri depolamak ve kullanmak için entegre bir veritabanına ihtiyacınız var. Veri entegrasyonunun temel amacı, kurumsal iş verilerinin durumunun tek ve eksiksiz bir resmini elde etmektir. Entegrasyonun kendisi, aşağıdakileri ayırmanın tavsiye edildiğine dayanan karmaşık bir süreçtir:
teknoloji,
Ürün:% s,
Uygulamalar
yöntemler veri entegrasyonuna yönelik yaklaşımlardır.
teknoloji- bunlar, belirli veri entegrasyonu yöntemlerini uygulayan süreçlerdir.
Ürün:% sşu veya bu veri entegrasyon teknolojisini destekleyen ticari çözümlerdir.
Uygulamalar- bunlar, geliştiriciler tarafından müşterilerin - müşterilerin isteklerine göre sağlanan hazır teknik çözümlerdir.
Kurumsal bilgi sistemlerinin karmaşıklığına ve çözmek için tasarlandıkları görevlere bağlı olarak, içlerindeki verilerin organizasyonu biraz farklıdır. Özellikle, hem bireysel şubelerin hem de bir bütün olarak şirketin iş süreçlerinin etkin bir şekilde yönetilmesini sağlamak için tasarlanan BDT'de, kurumsal veritabanlarının varlığından bahsetmek gelenekseldir. Yönetimin en üst kademelerinde kullanılan ve çoğunlukla operasyonel analiz ve karar verme süreçleriyle ilişkilendirilen kurumsal bilgi sistemlerinde, çeşitli yönetim faaliyetlerinin planlanması, tasarlanması ve tahmin edilmesi sürecinde veri ambarı terminolojisi kullanılmaktadır. ifadesinin yer aldığını belirtmekte fayda var. entegre bilgi depolama ikisine de aittir.
5.2. Kurumsal veritabanları ve gereksinimleri
Sistem genelinde entegre bir veri deposu olan kurumsal veri tabanı, kurumun tüm iş süreçlerinin ve bölümlerinin etkin yönetimi için bilgi sağlamak üzere tasarlanmıştır. Veri entegrasyonu, bireysel ayrı bölümlerin veri tabanlarından gelen verileri organik olarak içeren yeni bir yapının oluşturulmasını içerir, bu nedenle böyle bir yapı belirli gereksinimleri sağlamalıdır:
Veritabanına basit ve kullanıcı dostu veri girişi,
Verilerin aşırı veri büyümesine yol açmayacak biçimde saklanması,
Erişim haklarının sınırlandırılması zorunlu şartına bağlı olarak, şirketin tüm bölümlerindeki çalışanların genel bilgilerine erişilebilirliği,
Gerekli bilgilerin hızlı bir şekilde bulunması ve seçilmesi,
Gerekli verilerin sıralanması ve filtrelenmesi,
Benzer verileri gruplama
Alanlar üzerinden ara ve son hesaplamalar,
Çıktı verilerinin dönüştürülmesi ve görünürlüğü,
ölçeklenebilirlik,
· Kazara oluşan arızalara, kalıcı veri kayıplarına ve yetkisiz erişime karşı güvenlik.
Ayrıca, ayrı (dağıtılmış) veritabanlarını tek bir kurumsal veri tabanına entegre ederken, veri tabanı ile kullanıcının dağıtılmamış gibi çalışacağı şekilde çalışabilmesini sağlamak önemlidir.
Entegre bir kurumsal veritabanının oluşturulması, başlıcaları olan çeşitli yöntemlerle mümkündür:
· Konsolidasyon,
federalizasyon,
· Yayma.
5.3. Kurumsal veri tabanları için entegrasyon çözümlerinin özellikleri
Konsolidasyon. Altında konsolidasyon genellikle aynı ada sahip verilerin eklenmesini ifade eder. Benzer bir terim, ana bankanın tüm varlık ve yükümlülüklerini şubeleri ile birlikte sunmanıza olanak tanıyan yıllık konsolide bilançonun oluşturulduğu bankacılık sektöründe yaygın olarak kullanılmaktadır.
Bir kurumla ilgili olarak, bu yöntemi kullanırken, veriler tek bir depolama konumuna (DB - Master) entegre edilerek birincil veritabanlarından (DB - Slave) kopyalanır ve toplanır. Kural olarak, merkez (merkez) ofisin sunucusu böyle bir depolama yeri olarak seçilir (Şekil 5.1).
Şekil 5.1. Veri Konsolidasyon Yöntemi
DB - Master'daki veriler, raporlama, analiz, geliştirme ve karar verme için kullanılır ve ayrıca şirketin diğer şubeleri için bir veri kaynağı olur.
Konsolidasyon sırasında bu tür çözümleri desteklemek için en yaygın teknolojiler aşağıdaki teknolojilerdir:
Çıkarma, dönüştürme ve yükleme - ETL (Dönüştürme Yükünü Çıkarma);
· Kurumsal içerik yönetimi - ECM (Kurumsal İçerik Yönetimi).
Konsolidasyon yönteminin avantajları şunlardır:
1. dönüştürme yeteneği ETL teknolojisi nedeniyle birincil sistemlerden nihai depolama yerlerine aktarım sürecinde önemli miktarda verinin (yeniden yapılandırılması, mutabakatı, temizlenmesi ve/veya birleştirilmesi)
2. Yapılandırılmamış verileri yönetme yeteneği ECM teknoloji çözümleri sayesinde belgeler, raporlar ve sayfalar gibi.
Konsolide BDT veritabanı ile çalışmak için özel iş uygulamaları, Bu, veritabanı verilerine, raporlara sorgular oluşturmanıza ve bunlara dayalı olarak veri analizi yapmanıza olanak tanır.
Konsolidasyon yoluyla entegrasyonun dezavantajı, senkronizasyon çakışmaları nedeniyle entegre depolama konumundaki konsolide verilerin birincil sistemlerdeki veri güncellemeleriyle senkronize olarak güncellenememeleridir.
Birincil sistemlerde ve nihai depolama konumunda veri güncelleme anları arasında bir zaman gecikmesinin varlığı.
Bu gecikme birkaç saniyeden birkaç saate hatta günlere kadar değişebilir.
Federalizasyon. Altında federalleşme genellikle birlik olarak anılır. Benzer bir terim, bir devletin sınırlarını düzenlerken (örneğin, Almanya, Rusya, ABD) siyasette sıklıkla kullanılır.
Kurumsal bir veri tabanında veri birleştirme süreci, birkaç birincil veri dosyasını tek bir sanal bütün halinde birleştiren sanal (görünür) bir resmin oluşturulmasıdır (bkz. Şekil 5.2). Veri federalizasyonunun kendisi, harici gereksinimlere dayalı olarak birincil sistemlerden verilerin çıkarılmasından oluşur. Federal yönteme göre entegre kurumsal veri tabanının yönetimi, federalizasyon işlemcisi
İncir. 2. Veri birleştirme yöntemi
Veriler için sanal veritabanına dönersek, herhangi bir iş uygulaması sanal resme bir istek oluşturur. Bu isteğe bağlı olarak, federasyon işlemcisi ilgili birincil sistemlerden verileri çıkarır, bunları sanal resme göre entegre eder ve sonucu, talebi oluşturan iş uygulamasına döndürür. Bu durumda gerekli tüm veri dönüşümleri birincil sistemlerden çıkarıldığında gerçekleştirilir.
Veri entegrasyonuna yönelik birleşik bir yaklaşım desteği, Kurumsal Bilgi Entegrasyonu anlamına gelen Kurumsal bilgi entegrasyonu (E I I) teknolojisi tarafından sağlanır.
Birleştirilmiş çözümün bir özelliği, birincil verilere erişmek için federasyon işlemcisinin meta veri(bilgi), birincil sistemlere erişimi optimize etmek için federatif çözüme yardımcı olan, sanal resmin bileşimi ve özellikleri, veri miktarı, bunlar arasındaki anlamsal ilişkiler ve bunlara erişim yolları hakkındaki verileri içerir.
Federasyon yaklaşımının başlıca avantajları şunlardır:
ek yeni bir veritabanı oluşturmadan mevcut verilere erişme yeteneği,
şirketlerin devralınması veya birleşmesi sonrasında başvurunun uygunluğu,
güvenlik nedenleriyle birincil sistemlerden veri kopyalamaya ilişkin lisans kısıtlamalarının olduğu durumlarda vazgeçilmez,
Gerekirse, şirketin yerel bölümlerinin yüksek özerkliğini ve faaliyetlerinin merkezi kontrolünün esnekliğini kullanmak,
· Büyük ulusötesi şirketler için yüksek derecede fayda.
Yaklaşımın dezavantajları şunları içerir:
Birden fazla veri kaynağına erişmenin ek maliyeti nedeniyle düşen performans,
federalleştirme, az miktarda veriyi çıkarmak için en uygun olanıdır,
Birincil veriler için yüksek kalite gereksinimleri.
Yayma. Altında yayılmış genellikle çoklu nesnelerin bölgesel transferini ifade eder. Veri yayılımı, birincil veritabanlarının çoğaltılmasını ve bir yerden diğerine taşınmasını ifade eder. Bu yöntemi uygularken iş uygulamalarıçevrimiçi çalışın ve meydana gelen belirli olaylara göre verileri hedeflere taşıyın. Bu teknik çözüm için, senkron veya asenkron modlarda mümkün olan verilerin güncellenmesi konusu önem kazanmaktadır.Senkron mod, hem birincil sistemdeki hem de son sistemdeki güncellemelerin aynı fiziksel işlem sırasında gerçekleştiğini varsayar.
Veri yayma yönteminin uygulanmasını destekleyen teknoloji örnekleri şunlardır:
Kurumsal uygulamaların entegrasyonu EAI - Kurumsal Uygulama Entegrasyonu,
· Kurumsal verilerin replikasyonu EDR – Enterprise Data Replication.
Veri yayma yönteminin uygulanmasının genelleştirilmiş yapısı, Şekil 5.3'ün formuna sahiptir.
Şekil 5.3. Veri yayma yöntemi
Veri dağıtım yönteminin ayırt edici bir özelliği, verilerin hedef sisteme gerçek zamana yakın minimum gecikmeyle garantili teslimidir.
Yöntemde teknoloji entegrasyonu (EAI) ve çoğaltma (EDR) kombinasyonu, aşağıdaki avantajlar şeklinde birçok avantaj sağlar:
· Yüksek performans,
Veri yeniden yapılandırma ve temizleme imkanı,
· Yedekler oluşturarak ve verileri geri yükleyerek yük dengeleme.
hibrit yaklaşım. Ekonomik faaliyetin gerçekliği öyledir ki, iki özdeş işletme, özellikle de iki özdeş şirket yoktur. Bu durum, BDT oluşturma ve doldurma sürecine damgasını vurmaktadır. Bu tamamen veritabanlarına veri entegre etme yöntemleri için geçerlidir. Bu nedenle birçok EIS, veri entegrasyonu uygulamalarında sözde veri entegrasyonunu kullanır. melez Aynı anda birkaç entegrasyon yöntemini içeren bir yaklaşım. Bu yaklaşımın örnekleri, müşteri bilgilerinin tutarlı bir resmini sağlayan teknolojilerdir:
Müşteri verilerinin CDI sistemlerine entegrasyonu - Müşteri Verileri Entegrasyonu,
· Müşteri verilerinin CRM – Müşteri İlişkileri Yönetimi modüllerine entegrasyonu.
Özellikle, CDI uygulama yaklaşımı çeşitli şekillerde ele alınabilir.
En kolay yol, birincil sistemlerden gelen verileri içeren birleştirilmiş bir müşteri veritabanı oluşturmaktır. Aynı zamanda, bilgi birikimi, farklı konsolidasyon modları kullanılarak düzenlenebilir: bu bilgilerin güncellenme sıklığına bağlı olarak operasyonel veya toplu.
İkinci yol, sanal olduğunda veri federasyonudur. iş sunumları birincil sistemlerde bulunan müşteri verileri. Ve meta veri dosyası, müşteri bilgilerini ilişkilendirmek için kullanılabilecek ortak anahtar öğeleri içerebilir.
Böylece genel (örneğin ayrıntılar) müşteri verileri en statik veriler olarak konsolide edilebilir. Ve daha dinamik veriler (sipariş ayrıntıları gibi) birleştirilebilir.
Ayrıca, hibrit yaklaşım, veri yayma yöntemi kullanılarak genişletilebilir. Örneğin, bir İnternet mağazasının hizmetlerini kullanan bir müşteri, hizmet sırasında ayrıntılarını değiştirir. Bu değişiklikler, veritabanının birleştirilmiş kısmına gönderilebilir ve oradan mağaza müşteri verilerini içeren tüm birincil sistemlere yayılabilir.
Yöntemlerin her birinin avantaj ve dezavantajlarını göz önünde bulundurarak, uygulama ve paylaşımlarında yaratıcı olunması tavsiye edilir.
Örneğin, veri birleştirme maliyeti, konsolidasyonun sağladığı iş avantajlarından daha ağır bastığında veri birleştirme yararlıdır. Özellikle taleplerin hızlı bir şekilde işlenmesi ve raporların hazırlanması tam da böyle bir durumdur.
Veri yayma yönteminin pratik uygulaması, hem performans hem de verileri yeniden yapılandırma ve temizleme yeteneği açısından çok çeşitlidir.
5.4. Veri ambarlarının konsepti ve yapısal çözümleri
Bilgi deposu - karar verme ve veri analizi süreçlerinin oluşturulduğu diğer sistemlerden gelen verilerin yanı sıra harici ve operasyonel verileri toplayan, konu odaklı entegre bir bilgi deposudur.
Veritabanları ve veri bankalarından farklı olarak, veri ambarları dahili değil, harici veri kaynaklarına dayanır: çeşitli bilgi sistemleri, elektronik arşivler, halka açık elektronik kataloglar, dizinler ve koleksiyonlar.
Veri ambarları kavramı iki ana fikir üzerine kuruludur:
1. Birbirinden farklı ayrıntılı verilerin (belirli gerçekleri, özellikleri, olayları vb. açıklayan) tek bir havuzda entegrasyonu.
2. İşleme ve analiz için kullanılan veri kümelerinin ve uygulamaların ayrılması.
Veri depolama, aşağıdakilerin elde edilmesinin gerekli olduğu durumlarda düzenlenir:
Güncel ve geçmiş veri değerlerinin entegrasyonu,
Farklı kaynaklardan gelen verilerin konsolidasyonu,
Analitik amaçlı güvenilir bir veri platformunun oluşturulması,
Kurum genelinde veri homojenliğinin sağlanması,
Mevcut işletim sistemlerini değiştirmeden kurumsal veri standartlarının uygulanmasını kolaylaştırmak,
· Geniş bir tarihsel resim ve gelişme eğilimlerini analiz etmek için fırsatlar sağlamak.
Tarihsel olarak, veri ambarları bir, iki ve üç katmanlı bir şema üzerine inşa edilmiştir.
Tek seviyeli şemalarİlk olarak, operasyonel sistemlerden gelen veriler kullanılarak analiz yapıldığında, az gelişmiş bir bilgi altyapısına sahip, işlevsel DSS'yi içeren en basit mimariler için tasarlanmıştır: veri - sunum formları.
Bu tür planların avantajları şunlardır:
Ara bağlantılar olmadan operasyonel sistemlerden özel bir sisteme hızlı veri aktarımı,
· Tek platform kullanımından kaynaklanan minimum maliyetler.
Dezavantajları:
Tek bir veri kaynağı nedeniyle çözülmesi gereken dar kapsamlı sorunlar,
· Bir temizleme adımının olmaması nedeniyle düşük veri kalitesi.
İki seviyeli şemalar bir zincir sağlayın: veri - veri pazarları - sunum formları. Kendi bilgi teknolojilerini kullanan çok sayıda bağımsız bölümü olan şirketlerde kullanılırlar.
Avantajlar:
Kullanılan vitrinler, belirli bir dizi soruyu cevaplamak için tasarlanmıştır,
· Performansı artıran vitrinlerdeki verileri optimize etmek mümkündür.
Dezavantajları:
Vitrinlerde tekrar tekrar olması nedeniyle veri tutarlılığının sağlanmasındaki zorluk,
Vitrinleri çok sayıda veri kaynağıyla doldurmanın potansiyel karmaşıklığı,
· Kurumsal düzeyde veri konsolidasyonu eksikliği göz önüne alındığında, işin tek bir resmi yoktur.
Gelişimin evrimi, modern kurumsal sistemler için tam teşekküllü bir veri ambarının inşasının aşağıdakilere göre gerçekleştirilmesine yol açmıştır. üç katmanlı mimari (bkz. şekil 5.4).
Üzerinde ilk düzeyde veri kaynağı olan çeşitli kayıt sistemleri vardır. Bu tür sistemler kurumsal kaynak planlama (ERP) sistemleri, referans (operasyonel) sistemler, dış kaynaklar veya haber ajanslarından veri sağlayan sistemler vb. olabilir.
Üzerinde saniye seviye, birinci seviyenin tüm kaynaklarından gelen verilerin toplandığı merkezi bir havuzun yanı sıra iki işlevi yerine getirmek üzere tasarlanmış bir operasyonel veri ambarı içerir:
Depo, operasyonel yönetim için kullanılan bir analitik bilgi kaynağıdır,
· Operasyonel depoda, merkezi depoya daha sonra yüklenmek üzere veriler hazırlanır. Verilerin hazırlanması altında, birinci seviyeden verilerin alınması için farklı düzenlemelerle bağlantılı olarak kontrollerin yapılması ve verilerin dönüştürülmesi anlamına gelir.
Üçüncü düzey, etki alanına özgü veri pazarlarının bir koleksiyonudur.
Veri marketleri – bunlar, içerikleri şirketin bireysel bölümlerinin analitik sorunlarının çözümüne katkıda bulunan, nispeten küçük işlevsel yönelimli sürücülerdir. Aslında, veri marketleri bir ambardaki verilerin alt kümeleridir. Aynı zamanda son kullanıcılar, data martta yeterli veri olmaması durumunda detaylı ambar verilerine erişme ve işin durumunun daha eksiksiz bir resmini elde etme olanağına sahiptir.
Şekil 5.4. Veri ambarı mimarisi
Bu tür organize veri ambarlarının ana teknolojik işlemleri şunlardır:
· çıkarma veri, heterojen kaynaklardan operasyonel bir ambara veri aktarma işlemidir,
· dönüşüm veri, verilerin özel kurallara göre değiştirilmesi ve daha sonra merkezi depolamaya aktarılmasıdır,
· temizlik veri, farklı kaynaklardan gelen verilerin tekrarının ortadan kaldırılmasıdır,
· Güncelleme veri, veri güncellemelerinin temel tabloların kaynak verilerine ve ambarda barındırılan türetilmiş verilere dağıtımıdır.
Avantajlar:
Tek bir saflaştırılmış veri kaynağının kullanılması nedeniyle vitrinlerin doldurulması basitleştirilmiştir,
· Data martları, kurumsal iş resmi ile senkronize edilir, bu da merkezi deponun genişletilmesini ve data martlarının eklenmesini kolaylaştırır,
· Garantili performans.
Dezavantajları:
Veri depolama teknolojisi gereksinimlerinde bir artışa yol açan veri yedekliliğinin varlığı,
5. 5. BDT'de veri tabanı yönetim sistemleri ve veri erişim teknolojileri
Veritabanı Yönetim sistemi(DBMS), bir veya daha fazla kullanıcı tarafından bir veritabanı oluşturmak, sürdürmek ve paylaşmak için tasarlanmış bir dizi dil ve yazılım aracıdır.
Şu anda, en yaygın olarak kullanılan VTYS, katı bir matematiksel aygıt tarafından tanımlanan ilişkisel bir veri modeli temelinde oluşturulmuştur. ilişki teorisi.
BDT'de çalışan DBMS'nin bir özelliği, uzayda dağıtılmış ortamlarda bulunan veritabanlarını yönetmek zorunda olmalarıdır.
BDT'de verilerin ek tekrarını veya kopyalanmasını önlemek için, ana vurgu, uzaktan veri işleme ilkesi üzerindedir. CIS'deki veritabanları, birçok kullanıcının ihtiyaç duyduğu verileri içerir. Kullanıcılarla ve tek bir veritabanı ile çalışan yerel bir bilgisayar ağı VTYS'si kurulurken, birkaç kullanıcının veritabanına aynı anda erişimini sağlamak mümkündür.
Veritabanları ile çok kullanıcılı çalışma için temel teknolojik çözümler dosya/sunucu ve istemci/sunucu teknolojileridir. Bu teknolojilerden en kabul edilebilir seçeneği alarak, BDT'deki istemci / sunucu, dağıtılmış veritabanlarını işlemek için özel sistemler düzenler. Aynı zamanda, dağıtılmış veritabanları, verilerin mantıksal düzeyde değil, fiziksel düzeyde dağıtılacağı şekilde yönetilir ve veritabanının kendisi tek bir "süper şema" olarak kabul edilir. Dağıtılmış bir veritabanında, yöneticinin işlevleri, birleşik veritabanı yöneticisi ve yerel veritabanı yöneticileri arasında paylaşılır. Entegre veritabanının yöneticisi, farklı kullanıcıların veritabanına erişiminin farklılaşmasını izler ve verilerin bütünlüğünü ve güvenliğini ve ayrıca birkaç kullanıcı tarafından aynı anda düzeltmeye karşı verilerin korunmasını sağlar. Erişim kontrolü, ağ işletim sisteminde bireysel kullanıcılara verilen haklar doğrultusunda gerçekleştirilir.
Uzak ve dağıtılmış kurumsal veritabanlarıyla çalışmak için DBMS yardımıyla oluşturulan programların karakteristik bir özelliği, açık bir veri erişim arayüzünün kullanılmasıdır - ODBC (Açık Veri Tabanı Bağlantısı). Tüm veri aktarım işlevleri, entegre veritabanının VTYS'si ile istemci uygulamalarının VTYS'si arasında bir bağlantı köprüsü olan ODBC arayüzüne atanır. Aynı zamanda, müşterinin VTYS'si sadece kendi yerel veritabanlarıyla değil, aynı zamanda entegre veri tabanında bulunan verilerle de etkileşime girebilir. İstemci, entegre veritabanının DBMS'sine istek gönderme, bunlarla ilgili verileri alma ve kendi güncellenmiş verilerini gönderme yeteneğine sahiptir.
Modellerin temel amacı, veri alanında yönlendirmeyi kolaylaştırmak ve iş geliştirme için önemli olan detayların vurgulanmasına yardımcı olmaktır. Günümüzün iş ortamında, çeşitli bileşenler arasındaki ilişkileri net bir şekilde anlamak ve organizasyonun büyük resmini iyi anlamak kesinlikle çok önemlidir. Modeller kullanılarak tüm detayların ve ilişkilerin tanımlanması, şirketin çalışmalarını organize etmek için zamanın ve araçların en verimli şekilde kullanılmasını sağlar.
Veri modelleri, verilerin nasıl temsil edildiğini ve erişildiğini açıklayan soyut modellerdir. Veri modelleri, belirli bir alanda veri öğelerini ve aralarındaki ilişkileri tanımlar. Veri modeli, belirli bir gerçek bilgi sınıfını doğru bir şekilde açıklamak için belirli bir dizi sembol ve kelime kullanan hem iş hem de BT uzmanları için bir gezinme aracıdır. Bu, organizasyon içindeki iletişimi geliştirir ve böylece daha esnek ve istikrarlı bir uygulama ortamı yaratır.
Veri modeli, bu durumda yapılandırılmış veri olan (değerin belirsiz olabileceği görüntü, ikili dosya veya metin gibi yapılandırılmamış verilerin aksine) verilerin anlamını benzersiz bir şekilde tanımlar.
Kural olarak, daha yüksek seviyeli (ve içerik olarak daha genel) ve daha düşük seviyeli (sırasıyla daha ayrıntılı) modeller ayırt edilir. Modellemenin üst seviyesi sözde kavramsal veri modelleri(kavramsal veri modelleri), bir işletmenin veya kuruluşun işleyişinin en genel resmini verir. Kavramsal model, kuruluşun işleyişi için kritik olan ana kavramları veya konu alanlarını içerir; genellikle sayıları 12-15'i geçmez. Böyle bir model, kuruluş için önemli olan varlık sınıflarını (iş nesneleri), özelliklerini (nitelikleri) ve bu sınıfların çiftleri arasındaki ilişkileri (yani ilişkiler) tanımlar. İş modelleme terminolojisi henüz tam olarak yerleşmediğinden, çeşitli İngilizce kaynaklarda, kavramsal veri modelleri konu alanı modeli (konu alanı modelleri olarak tercüme edilebilir) veya konu kurumsal veri modeli (konu kurumsal veri modelleri) olarak da adlandırılabilir. ).
Bir sonraki hiyerarşik seviye, mantıksal veri modelleri(mantıksal veri modelleri). Bunlara kurumsal veri modelleri veya iş modelleri de denilebilir. Bu modeller veri yapılarını, niteliklerini ve iş kurallarını içerir ve bir kuruluş tarafından iş perspektifinden kullanılan bilgileri temsil eder. Böyle bir modelde veriler, varlıklar ve aralarındaki ilişkiler şeklinde düzenlenir. Mantıksal model, verileri iş kullanıcıları tarafından kolayca anlaşılabilecek şekilde temsil eder. Mantıksal bir modelde, bir veri sözlüğü tahsis edilebilir - farklı kullanıcı kategorilerinin modelin tüm girdi ve bilgi çıktı akışları hakkında ortak bir anlayışa sahip olmasını sağlayan, tam tanımlarıyla birlikte tüm varlıkların bir listesi. Bir sonraki, daha düşük modelleme seviyesi, belirli yazılım araçları ve teknik platformlar kullanılarak mantıksal modelin fiziksel olarak uygulanmasıdır.
Mantıksal model, genellikle normalleştirilmiş bir model şeklini alan ayrıntılı kurumsal iş kararını içerir. Normalleştirme, modeldeki her veri öğesinin yalnızca bir değere sahip olmasını ve birincil anahtara tamamen ve benzersiz bir şekilde bağımlı olmasını sağlayan süreçtir. Veri öğeleri, benzersiz kimliklerine göre gruplar halinde düzenlenir. Veri öğelerini kontrol eden iş kuralları, geçerlilik ve doğruluklarının ön kontrolü ile normalleştirilmiş modele tam olarak dahil edilmelidir. Örneğin, Müşteri Adı gibi bir veri öğesi büyük olasılıkla Ad ve Soyadı olarak bölünecek ve diğer ilgili veri öğeleriyle birlikte Müşteri Kimliğinin birincil anahtarına sahip bir Müşteri varlığı içinde gruplandırılacaktır.
Mantıksal veri modeli, veritabanı, ağ oluşturma veya raporlama araçları gibi uygulama teknolojilerinden ve bunların fiziksel uygulamasından bağımsızdır. Bir kuruluşun yalnızca bir kurumsal veri modeli olabilir. Mantıksal modeller tipik olarak binlerce varlık, ilişki ve nitelik içerir. Örneğin, bir finans kurumu veya telekomünikasyon şirketi için bir veri modeli, yaklaşık 3.000 endüstri konsepti içerebilir.
Mantıksal ve anlamsal veri modeli arasında ayrım yapmak önemlidir. Mantıksal veri modeli, kurumsal iş çözümünü temsil ederken, anlamsal veri modeli, uygulanan iş çözümünü temsil eder. Aynı kurumsal mantıksal veri modeli, farklı anlamsal modeller kullanılarak uygulanabilir, yani. semantik modeller, fiziksel modellere yaklaşan bir sonraki modelleme seviyesi olarak düşünülebilir. Ayrıca, bu modellerin her biri, çeşitli uygulamaların gereksinimlerine göre kurumsal veri modelinin ayrı bir "dilim"ini temsil edecektir. Örneğin, kurumsal bir mantıksal veri modelinde, Müşteri varlığı tamamen normalleştirilir ve bir data mart için semantik bir modelde çok boyutlu bir yapı olarak temsil edilebilir.
Bir şirketin kurumsal mantıksal veri modeli oluşturmanın iki yolu olabilir: kendiniz oluşturun veya hazır bir model kullanın. endüstri modeli(endüstri mantıksal veri modeli). Bu durumda, terimlerdeki farklılıklar yalnızca aynı mantıksal modeli oluşturmaya yönelik farklı yaklaşımları yansıtır. Bir şirketin kendi mantıksal veri modelini bağımsız olarak geliştirmesi ve uygulaması durumunda, kural olarak böyle bir modele basitçe kurumsal mantıksal model denir. Kuruluş, profesyonel bir tedarikçinin bitmiş ürününü kullanmaya karar verirse, o zaman bir endüstri mantıksal veri modelinden bahsedebiliriz. İkincisi, belirli bir endüstrinin işleyişini yüksek derecede doğrulukla yansıtan hazır bir mantıksal veri modelidir. Bir endüstri mantıksal modeli, hem stratejik hem de taktiksel iş sorularını yanıtlamak için bir kurumsal veri ambarında olması gereken tüm bilgilerin etki alanına özgü ve entegre bir görünümüdür. Diğer herhangi bir mantıksal veri modeli gibi, endüstri modeli de uygulama çözümlerine bağlı değildir. Ayrıca, daha hızlı veri alımı için türetilmiş verileri veya diğer hesaplamaları içermez. Kural olarak, böyle bir modelin mantıksal yapılarının çoğu, etkin fiziksel uygulamasında iyi bir düzenleme bulur. Bu modeller birçok satıcı tarafından çok çeşitli alanlar için geliştirilmektedir: finans, üretim, turizm, sağlık, sigorta vb.
Bir endüstri mantıksal veri modeli, bir endüstri için ortak olan bilgileri içerir ve bu nedenle bir şirket için eksiksiz bir çözüm olamaz. Çoğu şirket, veri öğeleri ekleyerek ve tanımları genişleterek modeli ortalama %25 oranında artırmak zorundadır. Bitmiş modeller yalnızca temel veri öğelerini içerir ve geri kalan öğeler, modelin şirkete kurulumu sırasında uygun iş nesnelerine eklenmelidir.
Endüstri mantıksal veri modelleri, önemli sayıda soyutlama içerir. Soyutlama, benzer kavramların Etkinlik veya Katılımcı gibi ortak isimler altında birleştirilmesini ifade eder. Bu, endüstri modellerine esneklik katar ve onları daha birleşik hale getirir. Bu nedenle Event kavramı tüm sektörler için geçerlidir.
İş Zekası uzmanı Steve Hoberman, bir endüstri veri modeli satın alıp almamaya karar verirken dikkate alınması gereken beş faktörü özetliyor. Birincisi, modeli oluşturmak için gereken zaman ve kaynaklardır. Bir kuruluşun hızlı bir şekilde sonuçlara ulaşması gerekiyorsa, endüstri modeli bir avantaj sağlayacaktır. Bir endüstri modeli kullanmak, tüm organizasyonun bir resmini hemen sağlamayabilir, ancak önemli miktarda zaman kazandırabilir. Gerçek modelleme yerine, mevcut yapıları endüstri modeline bağlamak ve bunun organizasyonun ihtiyaçlarına göre en iyi nasıl özelleştirileceğini (örneğin, hangi tanımların değiştirilmesi ve hangi veri öğelerinin eklenmesi gerektiğini) tartışmak için zaman harcanacaktır.
İkinci faktör, modeli çalışır durumda tutmak için gereken zaman ve paradır. Bir kurumsal veri modeli, onu doğru ve güncel tutan bir metodolojinin parçası değilse, model çok hızlı bir şekilde eski hale gelecektir. Sektör veri modeli, dış kaynaklar tarafından güncel tutulduğu için bu riski önleyebilir. Elbette, organizasyon içinde meydana gelen değişiklikler, şirketin kendisi tarafından modele yansıtılmalıdır, ancak sektör değişiklikleri, tedarikçi tarafından modelde yeniden üretilecektir.
Üçüncü faktör, risk değerlendirme ve modelleme deneyimidir. Bir kurumsal veri modeli oluşturmak, hem iş hem de BT personelinden yetenekli kaynaklar gerektirir. Kural olarak, yöneticiler ya bir bütün olarak organizasyonun çalışmalarını ya da belirli bir bölümün faaliyetlerini iyi bilirler. Bunların çok azı işleriyle ilgili hem geniş (şirket çapında) hem de derin (birim çapında) bilgiye sahiptir. Çoğu yönetici genellikle yalnızca bir alanı iyi bilir. Bu nedenle, şirket çapında bir resim elde etmek için önemli iş kaynaklarına ihtiyaç vardır. Bu aynı zamanda BT personeli için gereksinimleri de artırır. Bir modeli oluşturmak ve test etmek için ne kadar fazla iş kaynağı gerekliyse, analistlerin o kadar deneyimli olması gerekir. Sadece işletme personelinden nasıl bilgi alınacağını bilmekle kalmamalı, aynı zamanda tartışmalı alanlarda ortak paydada bulunabilmeli ve tüm bu bilgileri bütünleşik bir şekilde sunabilmelidir. Modeli oluşturan kişi (çoğu durumda bu aynı analisttir) iyi modelleme becerilerine sahip olmalıdır. Kurumsal mantık modelleri oluşturmak, "gelecek için" modelleme ve karmaşık işleri kelimenin tam anlamıyla "kareler ve çizgiler"e dönüştürme becerisi gerektirir.
Öte yandan, endüstri modeli, üçüncü taraf uzmanların deneyimini kullanmanıza izin verir. Sektöre özel mantık modelleri, bir kuruluş içinde kurumsal veri modelleri geliştirirken ortaya çıkabilecek yaygın ve maliyetli sorunlardan kaçınmak için kanıtlanmış modelleme metodolojileri ve deneyimli profesyonellerden oluşan ekipler kullanır.
Dördüncü faktör, mevcut uygulama altyapısı ve satıcı ilişkileridir. Bir kuruluş zaten aynı satıcıdan birçok araç kullanıyorsa ve onlarla ilişkiler kurduysa, o zaman endüstri modelini onlardan da sipariş etmek mantıklıdır. Böyle bir model, aynı tedarikçinin diğer ürünleriyle serbestçe çalışabilecektir.
Beşinci faktör, endüstri içi bilgi alışverişidir. Bir şirketin aynı alanda faaliyet gösteren diğer kuruluşlarla veri paylaşması gerekiyorsa, bu durumda bir endüstri modeli çok yardımcı olabilir. Aynı sektördeki kuruluşlar, benzer yapısal bileşenleri ve terminolojiyi kullanır. Günümüzde çoğu sektörde şirketler işlerini başarılı bir şekilde yürütmek için verileri paylaşmak zorunda kalıyor.
Profesyonel satıcılar tarafından sunulan endüstri modelleri en etkili olanlardır. Kullanımlarının yüksek verimliliği, bu modellerin önemli düzeyde ayrıntı ve doğruluğu nedeniyle elde edilir. Genellikle birçok veri özniteliği içerirler. Ek olarak, bu modellerin yaratıcıları yalnızca kapsamlı modelleme deneyimine sahip olmakla kalmaz, aynı zamanda belirli bir sektör için model oluşturma konusunda da bilgilidir.
Endüstri veri modelleri, şirketlere iş bilgilerinin tek ve entegre bir görünümünü sağlar. Çoğu şirket, verilerini entegre etmeyi zor bulmaktadır, ancak bu, kurumsal çaptaki çoğu proje için bir ön koşuldur. The Data Warehousing Institute (TDWI) tarafından yapılan bir araştırmaya göre, ankete katılan kuruluşların %69'undan fazlası, entegrasyonun yeni uygulamanın benimsenmesinin önünde önemli bir engel olduğunu buldu. Aksine, veri entegrasyonunun uygulanması şirkete önemli bir gelir getiriyor.
Endüstri veri modeli, mevcut sistemlerle bağlantı kurmanın yanı sıra kurumsal kaynak planlaması (ERP), ana veri yönetimi, iş zekası, veri kalitesinin iyileştirilmesi ve çalışan gelişimi gibi kurumsal çaptaki projeler için büyük faydalar sağlar.
Bu nedenle, endüstri mantıksal veri modelleri, verileri entegre etmek ve işin bütünsel bir resmini elde etmek için etkili bir araçtır. Mantıksal modellerin kullanılması, kurumsal veri ambarlarının oluşturulması için gerekli bir adım gibi görünüyor.
Kurumsal veri tabanı, kurumsal bilgi sisteminin merkezi bağlantısıdır ve tek bir kurumsal bilgi alanı oluşturmanıza olanak tanır. Kurumsal veritabanları
Bu çalışma size uymuyorsa sayfanın alt kısmında benzer çalışmaların listesi bulunmaktadır. Arama butonunu da kullanabilirsiniz
V .1. Kurumsal sistemlerde verilerin organizasyonu. Kurumsal veri tabanları.
V .2. Kurumsal sistemlerde DBMS ve yapısal çözümler.
V.3. İnternet / İntranet teknolojileri ve kurumsal veritabanı erişim çözümleri.
V .1. KURUMSAL SİSTEMLERDE VERİ ORGANİZASYONU. KURUMSAL VERİTABANLARI
Kurumsal baz data, kurumsal bilgi sisteminin merkezi bağlantısıdır ve kurumun tek bir bilgi alanını oluşturmanıza olanak tanır. Kurumsal veri tabanları (Şekil 1.1).
Veritabanlarının çeşitli tanımları vardır.
Veritabanının altında (DB) Bir bilgisayarın depolama aygıtlarında depolanan tek bir veri kümesini oluşturacak şekilde mantıksal olarak ilişkili bir dizi bilgiyi anlayın. Bu set, otomatik kontrol sistemlerinin, veri işleme sistemlerinin, bilgi ve bilgi işlem sistemlerinin işleyişi sürecinde çözülen görevlerin ilk verileri olarak işlev görür.
Veritabanı terimini, paylaşmaya yönelik mantıksal olarak ilişkili verilerin bir koleksiyonu olarak kısaca formüle edebilirsiniz.
veritabanı altında bir veya daha fazla uygulama için en uygun şekilde kullanılabilecek şekilde minimum fazlalık ile birlikte depolanan bir veri koleksiyonunu ifade eder.
Veritabanları oluşturmanın amacı bir veri depolama biçimi olarak benimsenen algoritmalara (yazılım), kullanılan teknik araçlara, verilerin bilgisayardaki fiziksel konumuna bağlı olmayan bir veri sistemi oluşturmak. Veritabanı çok amaçlı kullanım (birkaç kullanıcı, birçok belge formu ve bir kullanıcının sorgusu) olduğunu varsayar.
Temel veritabanı gereksinimleri:
Bilgi anlaşılır sorunu çözebileceğiniz bir dizi gerçek, model ve buluşsal kural.
Bilgi tabanı (KB) Karar vericilerden alınan, kullanılan veri tabanları ve kuralların toplanması. Bilgi tabanı, uzman sistemlerin bir unsurudur.
ayırt edilmelidir verileri sunmanın farklı yolları.
Fiziksel bilgi - Bu, bilgisayarın belleğinde depolanan verilerdir.
Verilerin mantıksal temsili kullanıcının fiziksel veri temsiline karşılık gelir. Verilerin fiziksel ve karşılık gelen mantıksal temsili arasındaki fark, ikincisinin fiziksel veriler arasındaki bazı önemli ilişkileri yansıtmasıdır.
kurumsal veritabanı altında Otomatikleştirilmiş bir organizasyon hakkında gerekli tüm veri ve bilgileri bir biçimde veya başka bir şekilde birleştiren bir veritabanını anlayın. Kurumsal bilgi sistemlerinde böyle bir kavramentegre veritabanları, tek giriş ve çoklu bilgi kullanımı ilkesinin uygulandığı.
Pirinç. 1.1. Departmanların kurumun bilgi kaynakları ile etkileşiminin yapısı.
Kurumsal veri tabanları odaklanmış (merkezileştirilmiş) ve dağıtıldı.
Konsantre (merkezi) veritabanı verileri fiziksel olarak bir bilgisayarın depolama aygıtlarında depolanan bir veritabanıdır. Şek. 1.2, çeşitli platformlardaki veritabanlarına erişmek için bir sunucu uygulamasının bir diyagramını gösterir.
Şekil 1.2. Heterojen bir diyagram merkezi veritabanı
Bilgi işlemenin merkezileştirilmesi, geleneksel dosya sistemlerinin tutarsızlık, tutarsızlık ve veri fazlalığı gibi eksikliklerini ortadan kaldırmayı mümkün kıldı. Ancak veri tabanları büyüdükçe ve özellikle coğrafi olarak dağınık organizasyonlarda kullanıldığında sorunlar ortaya çıkmaktadır. Örneğin, bir kuruluşun çeşitli bölümlerinin verilere eriştiği bir telekomünikasyon ağ düğümünde bulunan konsantre veri tabanları için, bilgi hacminde ve işlem sayısında bir artış ile aşağıdaki zorluklar ortaya çıkar:
Yoğunlaştırılmış bir veritabanında güncellemeler sırasında bilgilerin güvenliğini, bütünlüğünü ve tutarlılığını sağlamak daha kolay olsa da, bu sorunlar bazı zorluklar yaratır. Veri ademi merkeziyetçiliği bu sorunlara olası bir çözüm olarak önerilmiştir. Ademi merkeziyetçilik şunları sağlar:
Düğümlerinde iş istasyonları (küçük bilgisayarlar) bulunan bir ağ oluşturmanın maliyeti, bir ana bilgisayar kullanarak benzer bir sistem oluşturmanın maliyetinden çok daha düşüktür. Şekil 1.3, dağıtılmış bir veritabanının mantıksal bir diyagramını göstermektedir.
Şekil 1.3. Dağıtılmış kurumsal veritabanı.
Dağıtılmış bir veritabanının aşağıdaki tanımını veriyoruz.
Dağıtılmış veritabanı - bu, bilgi ağının farklı düğümlerinde depolanan ve tek bir veri kümesi oluşturacak şekilde mantıksal olarak birbirine bağlanan bir bilgi, dosya (ilişki) koleksiyonudur (bağlantı işlevsel olabilir veya aynı dosyanın kopyaları aracılığıyla olabilir). Bu nedenle, mantıksal olarak birbirine bağlı, ancak fiziksel olarak aynı bilgisayar ağının parçası olan birkaç makinede bulunan bir dizi veri tabanıdır.
Dağıtılmış bir veritabanının özellikleri için en önemli gereksinimler şunlardır:
Konum şeffaflığı, kullanıcıların konumları hakkında hiçbir şey bilmeden veritabanlarıyla çalışmasına olanak tanır. Dağıtılmış veritabanı düğümlerinin özerkliği, her bir veritabanının diğerlerinden bağımsız olarak korunabileceği anlamına gelir. Dağıtılmış sorgu, farklı veritabanlarının nesnelerine (tablolar veya görünümler) erişimin gerçekleştiği bir sorgudur (SQL ifadesi). Dağıtılmış işlemler yürütülürken, ilgili tüm veritabanları üzerinde eşzamanlılık kontrolü uygulanır. Oracle7, dağıtılmış işlemleri gerçekleştirmek için iki aşamalı bilgi aktarım teknolojisini kullanır.
Dağıtılmış bir veritabanını oluşturan veritabanlarının homojen olması (yani aynı VTYS tarafından çalıştırılması) veya aynı işletim sistemi ortamında ve/veya aynı tür bilgisayarlarda çalışması gerekmez. Örneğin, bir veritabanı SUN OS(UNIX) çalıştıran bir SUN bilgisayarındaki bir Oracle veritabanı olabilir, ikinci bir veritabanı bir MVS işletim sistemi çalıştıran bir IBM 3090 anabilgisayarında bir DB2 DBMS tarafından çalıştırılabilir ve üçüncü bir veritabanı aşağıdakiler tarafından çalıştırılabilir. IBM ana bilgisayarında da bir SQL/DS DBMS, ancak bir VM işletim sistemi. Yalnızca bir koşul zorunludur - veritabanlarına sahip tüm makinelere parçası oldukları ağ üzerinden erişilebilir olmalıdır.
Dağıtılmış bir veritabanının ana görevi – verilerin ağ üzerinden dağıtılması ve buna erişim sağlanması. Bu sorunu çözmenin aşağıdaki yolları vardır:
Kavramsal düzeyde dağıtılmış bir veritabanı oluştururken aşağıdaki görevleri çözmeniz gerekir:
Sayısal olmayan bilgi işleme için güçlü bir araç olan bilgisayar sistemleri mimarisinin aktif olarak gelişen yeni alanlarından biri, veritabanı makineleri. Veritabanı makineleri, belgeler ve gerçekleri depolamak, aramak ve dönüştürmek, nesnelerle çalışmak gibi sayısal olmayan görevleri çözmek için kullanılır. Verinin, çevreleyen dünyanın nesneleri hakkında dijital ve grafik bilgi olarak tanımlanmasının ardından, sayısal ve sayısal olmayan işlemede veri kavramına farklı içerikler gömülür. Sayısal işleme, değişkenler, vektörler, matrisler, çok boyutlu diziler, sabitler vb. gibi nesneleri kullanırken sayısal olmayan işleme, dosyalar, kayıtlar, alanlar, hiyerarşiler, ağlar, ilişkiler vb. nesneleri kullanır. sayısal işleme, çalışan dosyasının kendisiyle değil, doğrudan nesneler (örneğin, belirli bir çalışan veya çalışan grubu) hakkındaki bilgilerle ilgilidir. Belirli bir kişiyi seçmek için çalışan dosyasını indekslemez; Burada istenen kaydın içeriğiyle daha çok ilgilenir. Büyük hacimli bilgiler genellikle sayısal olmayan işleme tabi tutulur. Çeşitli uygulamalarda, bu veriler üzerinde bu tür işlemler gerçekleştirilebilir, örneğin:
Veritabanı motorunu uygulamak için, paralel ve ilişkisel tek işlemciye alternatif olarak mimarilervon Neumanngerçek zamanlı olarak büyük miktarda bilgi ile çalışmanıza izin veren yapı.
Veritabanı motorları, bilgi temsili, uzman sistemler, çıkarım, örüntü tanıma vb. gibi yapay zeka kavramlarının keşfedilmesi ve uygulanmasıyla bağlantılı olarak önem kazanmaktadır.
Bilgi depoları. Günümüzde pek çok kişi, çoğu şirketin halihazırda birkaç veritabanı işlettiğini ve bilgiyle başarılı bir şekilde çalışmak için yalnızca farklı türde veritabanlarına değil, farklı nesil VTYS'lere de ihtiyaç duyulduğunu kabul ediyor. İstatistiklere göre, her kuruluş ortalama 2,5 farklı DBMS kullanıyor. Şirketlerin işlerini, daha doğrusu bu işle uğraşan kişileri, veritabanlarının teknolojik özelliklerinden "yalıtmak", kullanıcılara, fiziksel olarak nerede depolandığına bakılmaksızın tek bir kurumsal bilgi görünümü sağlamak için ihtiyaç belirgin hale geldi. . Bu, bilgi depolama teknolojisinin ortaya çıkmasını teşvik etti ( Veri Ambarı, DW).
DW'nin temel amacı, farklı veritabanlarında bulunan verilerin tek bir mantıksal temsilinin veya başka bir deyişle tek bir kurumsal veri modelinin oluşturulması.
Genel olarak bilgi teknolojisinin gelişmesi, özellikle de paralel bilgisayar alanındaki gelişmelere dayanan paralel sorgu işlemeye dayalı yeni veritabanlarının ortaya çıkması sayesinde yeni bir DW geliştirme turu mümkün oldu. Biz oluşturduk sorgu oluşturucularkarmaşık veritabanı sorguları oluşturmayı kolaylaştıran sezgisel bir grafik arayüz ile. çeşitli yazılımara katman yazılımısağlanan iletişimfarklı veritabanları türleri arasındave sonunda fiyatta keskin bir düşüş yaşadıbilgi depolama cihazları.
Bir şirketin yapısında bir veri bankası bulunabilir.
Veri tabanı - otomatik kontrol sistemlerinde ve bilgi ve bilgisayar sistemlerinde, bir grup kullanıcı veya sistemde çözülen bir dizi görev için merkezi bilgi desteği sağlayan işlevsel ve organizasyonel bileşen.
Veri tabanı temel amacı olan bir bilgi ve referans sistemi olarak kabul edilir:
Bu nedenle, modern bir veri bankası, teknik, sistem ve ağ araçlarını, veritabanlarını ve DBMS'yi, çeşitli amaçlar için bilgi alma sistemlerini içeren karmaşık bir yazılım ve donanım kompleksidir.
V .2. KURUMSAL SİSTEMLERDE VTYS VE YAPISAL ÇÖZÜMLER
Veritabanı ve bilgi yönetim sistemleri
Modern bilgi sistemlerinin önemli bir bileşeni, veritabanı yönetim sistemleridir (DBMS).
VTYS - veritabanları oluşturmak, sürdürmek ve kullanmak için tasarlanmış bir dizi yazılım ve dil aracı.
Veritabanı yönetim sistemi, veri işleme sistemlerine veritabanlarına erişim sağlar. Daha önce belirtildiği gibi, kurumsal bilgi sistemlerinin oluşturulmasında DBMS'nin önemli bir rolü ve modern ağ bilgisayar teknolojilerine dayalı dağıtılmış bilgi kaynakları kullanılarak bilgi sistemlerinin oluşturulmasında özellikle önemli bir rol elde edilmektedir.
Modern DBMS'nin ana özelliği, modern DBMS'nin aşağıdaki gibi teknolojileri desteklemesidir:
Modern DBMS, yukarıda listelenen veritabanı gereksinimlerini karşılamalıdır. Ayrıca, aşağıdaki ilkelere uymaları gerekir:
Bir VTYS'yi otomatikleştirilmiş sistemlerde veritabanlarının bakımına odaklanan bir yazılım ürünleri sınıfı olarak düşünürsek, VTYS türlerini belirleyen en önemli iki özelliği ayırt edebiliriz. Onlara göre DBMS iki açıdan ele alınabilir:
Kurumsal (dağıtılmış) veritabanlarıyla ilgili olarak, aşağıdaki VTYS türleri geleneksel olarak ayırt edilebilir:
Bunlar Oracle, DВ2, SQL/Server, Informix, Sybase, ADABAS, Titanium gibi DBMS'dir ve diğerleri kurumsal veritabanlarının işlenmesi için geniş bir hizmet sunar.
Veritabanlarıyla çalışırken, işlem mekanizması kullanılır.
işlem mantıksal bir iş birimidir.
işlem yürütülen bir dizi veri işleme ifadesidirtek olarak(hepsi ya da hiçbiri) ve çeviri veritabanıbir bütünsel durumdan başka bir bütünsel duruma.
Bir işlemin ASID özellikleri olarak bilinen dört önemli özelliği vardır:
İşlem genellikle kullanıcının VTYS'ye katıldığı andan itibaren otomatik olarak başlar ve aşağıdaki olaylardan biri gerçekleşene kadar devam eder:
Kullanıcı için genellikle giyer atomik karakter. Aslında bu, kullanıcı (uygulama) ve veritabanı arasındaki karmaşık bir etkileşim mekanizmasıdır. Kurumsal sistem yazılımı, gerçek zamanlı bir işlem işleme motoru kullanır (Çevrimiçi İşlem İşleme Sistemleri, OLTP), özellikle muhasebe programları, müşteri uygulamalarını almak ve işlemek için yazılımlar, finansal uygulamalar, birçok bilgi üretir. Bu sistemler, büyük miktarda veriyi, karmaşık işlemleri ve yoğun okuma/yazma işlemlerini işlemek için tasarlanmıştır (ve uygun şekilde optimize edilmiştir).
Ne yazık ki, OLTP sistemlerinin veri tabanlarına yerleştirilen bilgiler, sıradan kullanıcılar tarafından kullanım için çok uygun değildir (yüksek derecede tablo normalizasyonu, belirli veri sunum formatları ve diğer faktörler nedeniyle). Bu nedenle, farklı bilgi işlem hatlarından gelen veriler (kopyalanmak anlamında) kullanıcıya gönderilir. depolama deposu, sıralama ve tüketiciye müteakip teslimat. Bilgi teknolojisinde, depoların rolü şu kişiler tarafından oynanır:bilgi depoları.
Bilginin son kullanıcıya teslimi - gerçek zamanlı olarak analitik veri işleme sistemleri devreye girer (Çevrimiçi Analitik İşleme, OLAP), sorgular oluşturmak ve sonuçları analiz etmek için uygun araçlar aracılığıyla verilere son derece kolay erişim sağlar. OLAP sistemlerinde, çeşitli analiz ve istatistiksel işleme yöntemleri kullanılarak bir bilgi ürününün değeri artırılır. Ek olarak, bu sistemler veri çıkarma hızı, genelleştirilmiş bilgilerin toplanması açısından optimize edilmiştir ve sıradan kullanıcılara odaklanmıştır (sezgisel bir arayüze sahiptirler). Eğer OLTP sistemi "Ocak 199x'te M bölgesinde N ürününün satış düzeyi neydi?" gibi basit sorulara yanıt verir, ardından OLAP sistemleri daha karmaşık kullanıcı istekleri için hazırsınız, örneğin: "Önceki iki yıla kıyasla ikinci çeyrek planına göre tüm bölgeler için N ürününün satışlarının bir analizini verin."
İstemci/sunucu mimarisi
Modern sistemlerde dağıtılmış bilgi işlemeteknoloji ön plana çıkıyor müşteri sunucusu. sistemde istemci-sunucu mimarileriveri işleme, aralarındaki iletişim bir ağ üzerinden gerçekleşen bir istemci bilgisayar ve bir sunucu bilgisayar arasında bölünür. Veri işleme süreçlerinin bu ayrımı, işlevlerin gruplandırılmasına dayanmaktadır. Tipik olarak, bir istemci bilgisayar uygulama programlarını çalıştırırken, bir veritabanı sunucusu bilgisayarı veritabanı işlemlerini gerçekleştirmek için ayrılmıştır. Şekil 2.1, sunucu görevi gören bir bilgisayar ve istemcisi olarak görev yapan başka bir bilgisayarı içeren basit bir istemci-sunucu mimarisi sistemini göstermektedir. Her makine farklı işlevleri yerine getirir ve kendi kaynaklarına sahiptir.
Veri tabanı |
||
sunucu bilgisayar |
||
Ağ |
||
IBM uyumlu bilgisayar |
IBM uyumlu bilgisayar |
IBM uyumlu bilgisayar |
Uygulamalar |
Pirinç. 2.1. İstemci-sunucu mimarisi sistemi
İstemci bilgisayarın ana işlevi, uygulamayı (kullanıcı arayüzü ve sunum mantığı) çalıştırmak ve uygulama tarafından gerektiğinde sunucu ile iletişim kurmaktır.
sunucu - Bu, istekleri üzerine diğer nesnelere hizmet sağlayan bir nesnedir (bilgisayar).
Terimden de anlaşılacağı gibi, sunucu bilgisayarın ana işlevi, istemcinin ihtiyaçlarına hizmet etmektir. "Sunucu" terimi, iki farklı işlev grubunu belirtmek için kullanılır: bir dosya sunucusu ve bir veritabanı sunucusu (bundan böyle bu terimler, bağlama bağlı olarak, bu işlev gruplarını uygulayan yazılım veya bu yazılıma sahip bilgisayarlar anlamına gelir). ). Dosya sunucuları veritabanı işlemlerini gerçekleştirmek için tasarlanmamıştır, ana işlevleri dosyaları birkaç kullanıcı arasında paylaşmaktır, yani. birçok kullanıcının bilgisayardaki dosyalara aynı anda erişmesini sağlamak - bir dosya sunucusu. Dosya sunucusuna bir örnek, Novell'in NetWare işletim sistemidir. Veritabanı sunucusu, bir dosya sunucusu bilgisayarına kurulabilir ve çalıştırılabilir. NLM (Ağ Yüklenebilir Modülü) biçimindeki Oracle DBMS, bir dosya sunucusunda NetWare ortamında çalışır.
Yerel ağ sunucusu, işlevsel amacına ve ağın gereksinimlerine uygun kaynaklara sahip olmalıdır. Açık sistem yaklaşımına yönelim nedeniyle, farklı bilgisayarlarda bulunması gerekmeyen mantıksal sunuculardan (yani bu kaynaklar üzerinden hizmet sağlayan bir dizi kaynak ve yazılım aracı anlamına gelir) bahsetmenin daha doğru olduğunu unutmayın. Açık bir sistemdeki mantıksal sunucunun bir özelliği, verimlilik nedeniyle sunucunun ayrı bir bilgisayara taşınması uygunsa, bunun hem kendisinde hem de uygulamada herhangi bir değişiklik yapılmasına gerek kalmadan yapılabilmesidir. kullanan programlar.
Önemli sunucu gereksinimlerinden biri, veritabanı sunucusunun barındırıldığı işletim sisteminin çok görevli (ve tercihen, ancak zorunlu olarak değil, çok kullanıcılı) olması gerektiğidir. Örneğin, çoklu görev gereksinimini karşılamayan MS-DOS (veya PC-DOS) işletim sistemine sahip bir kişisel bilgisayara kurulan Oracle DBMS, veritabanı sunucusu olarak kullanılamaz. Ve çok görevli (çok kullanıcılı olmasa da) OS / 2 işletim sistemine sahip bir bilgisayara kurulu aynı Oracle DBMS, bir veritabanı sunucusu olabilir. UNIX, MVS, VM ve diğer bazı işletim sistemlerinin birçok çeşidi hem çok görevli hem de çok kullanıcılıdır.
Dağıtılmış Bilgi İşlem
"Dağıtılmış bilgi işlem" terimi genellikle birbirini tamamlayıcı olmakla birlikte iki farklı kavramı belirtmek için kullanılır:
Bu kavramların uygulanması, çeşitli araçlar kullanarak son kullanıcılar için çeşitli makinelerde depolanan bilgilere erişimi düzenlemeyi mümkün kılar.
Birçok sunucu türü vardır:
İstemci/Sunucu teknolojisinin özünde Aşağıdaki gibi temel teknolojiler vardır:
İstemci-sunucu teknolojisinin avantajları:
Dağıtılmış Hesaplama. Dağıtılmış bilgi işlem, işin birkaç bilgisayar arasında dağıtılmasını içerir (dağıtılmış bilgi işlem daha geniş bir kavram olmasına rağmen).
küçültme. Ölçek küçültme, ana bilgisayar uygulamalarının küçük bilgisayar platformlarına aktarılmasıdır.
Genel uygulama yürütme süresinin azaltılması;
Azaltılmış istemci bellek kullanımı;
Ağ trafiğini azaltmak.
Arka uç arayüzü tanımlanır ve sabitlenir. Bu nedenle, mevcut bir sistemin yeni istemci parçalarını oluşturmak mümkündür (sistem düzeyinde birlikte çalışabilirlik örneği).
Pirinç. 2.2. Bir sunucu paylaşımına istemci erişiminin bir örneği.
İstemci-sunucu teknolojisi nasıl uygulanır
İstemci-sunucu teknolojisine dayalı ve dağıtık veri işleme yeteneğine sahip bir sistemin kurulumu aşağıda tartışılmaktadır. Aşağıdaki bilgisayar donanımı ve yazılımı gereklidir:
SQL dili . Üst düzey sorgu dili - SQL (Yapılandırılmış Sorgu Dili ) NMD, NDL ve PJD gibi veritabanlarına sorguları uygulamak için kullanılır ve bir standart olarak kabul edilmiştir. Dilim SQL başlangıçta firmanın yazılım ürünlerinin veri dili olarak kabul edildi IBM ve ilişkisel bir DBMS'nin YMD'si IBM'den SİSTEM R . Dilin önemli bir özelliği SQL aynı dilin iki farklı arabirim aracılığıyla temsil edilmesidir, yani: etkileşimli bir arabirim aracılığıyla ve bir uygulama programlama arabirimi (dinamik SQL). Dinamik SQL birçok yerleşik dil özelliğinden oluşur SQL , özellikle etkileşimli uygulamalar oluşturmak için sağlanmıştır; burada bir etkileşimli uygulama, etkileşimli terminalde çalışan son kullanıcı tarafından veritabanına erişimi desteklemek için yazılmış bir programdır. Dilim SQL veritabanı verilerini tanımlama, işleme ve yönetme işlevlerini sağlar ve uygulanan VTYS'nin bakış açısından kullanıcı için şeffaftır.
Pirinç. 2.3. Dağıtılmış veritabanlarına kullanıcı isteklerini yürütmek için şema.
Veritabanlarının iç yapısı, kullanılan veri modelleri tarafından belirlenir. Kavramsal model, harici modellerden daha fazla soyutlama yeteneğine ve daha zengin anlambilime sahiptir. Dış modeller, veritabanı ile kullanıcı etkileşiminin bir aracı olarak yönetimin ve uygulamanın sözdizimsel doğasına atıfta bulunarak, genellikle sözdizimsel veya operasyonel modeller olarak adlandırılır. Bilgi modellemede, kavramsal model seviyesinden fiziksel veri modeli seviyesine kadar VTYS mimarisini etkileyen çeşitli soyutlama seviyeleri vardır.
Veri modeli üç bileşenden oluşur:
VTYS'nin en önemli özelliklerinden biri nesneleri bağlama yeteneğidir.
Nesneler arasında aşağıdaki bağlantı türleri vardır:
Aşağıdaki ana veri modelleri vardır:
V.3. İNTERNET / INTRANET TEKNOLOJİLERİ VE KURUMSAL VERİTABANI ERİŞİM ÇÖZÜMLERİ
"İstemci-sunucu" mimarisine dayalı sistemlerin temel sorunu, açık sistem kavramına uygun olarak, mümkün olan en geniş açık sistem donanım ve yazılım çözümleri sınıfında mobil olmaları gerekliliğidir. Kendimizi UNIX tabanlı yerel alan ağlarıyla sınırlasak bile, farklı ağlar farklı ekipman ve iletişim protokolleri kullanır. Tüm olası protokolleri destekleyen sistemler oluşturmaya çalışmak, işlevsellik pahasına ağ ayrıntılarıyla aşırı yüklenmelerine yol açar.
Bu sorunun daha da karmaşık bir yönü, heterojen bir yerel ağın farklı düğümlerinde verilerin farklı temsillerinin kullanılması olasılığı ile ilgilidir. Farklı bilgisayarlarda farklı adresleme, sayıların temsili, karakter kodlaması vb. olabilir. Bu özellikle üst düzey sunucular için önemlidir: telekomünikasyon, bilgi işlem, veritabanları.
"İstemci-sunucu" mimarisine dayalı sistemlerin hareketliliği sorununa ortak bir çözüm, uzaktan prosedür çağrı protokollerini (RPC - Uzaktan Prosedür Çağrısı) uygulayan yazılım paketlerine güvenmektir. Bu araçları kullanarak, uzak ana bilgisayardaki bir hizmeti aramak normal bir prosedür çağrısı gibi görünür. Elbette, yerel ağ ekipmanı ve ağ protokollerinin özellikleriyle ilgili tüm bilgileri içeren RPC araçları, çağrıyı bir dizi ağ etkileşimine dönüştürür. Böylece ağ ortamının ve protokollerin özellikleri uygulama programlayıcısından gizlenir.
Bir uzak prosedür çağrıldığında, RPC programları istemci veri formatlarını ara makineden bağımsız formatlara ve ardından sunucu veri formatlarına dönüştürür. Yanıt parametreleri geçerken benzer dönüşümler gerçekleştirilir.
İlginizi çekebilecek diğer ilgili çalışmalar.vshm> |
|||
6914. | Veritabanı konsepti | 11.56KB | |
Veritabanı, mahkeme kararlarının normatif eylemlerinin hesaplanmasına ilişkin makalelerin nesnel bir biçiminde sunulan bir dizi bağımsız materyal ve bu materyallerin elektronik bir bilgisayar kullanılarak bulunabileceği ve işlenebileceği şekilde sistematize edilmiş diğer benzer materyaller Rusya Federasyonu Medeni Kanunu Sanat. Belirli kurallara göre düzenlenen ve bilgisayarın belleğinde tutulan bir veri tabanı, bazılarının mevcut durumunu karakterize eden bir dizi veri ... | |||
8064. | Dağıtılmış veritabanları | 43.66KB | |
Dağıtılmış veritabanları Dağıtılmış bir RDB veritabanı, bir bilgisayar ağının farklı düğümleri üzerinde fiziksel olarak dağıtılan, mantıksal olarak birbirine bağlı paylaşılan bir veri kümesidir. Veri erişimi, veri replikalarının varlığına veya yokluğuna bağlı olmamalıdır. Sistem, bir veri birleştirme birleştirmesini, aktarılan bilgi miktarını idare edebilen bir ağ bağlantısını ve tablolara katılmak için yeterli işlem gücüne sahip bir düğümü gerçekleştirmek için yöntemleri otomatik olarak belirlemelidir. RDBMS aşağıdaki özelliklere sahip olmalıdır ... | |||
20319. | VERİTABANLARI VE KORUNMASI | 102.86KB | |
Çevrimiçi çevrimiçi veritabanları 1960'ların ortalarında ortaya çıktı. Operasyonel veri tabanları üzerindeki işlemler, terminaller kullanılarak interaktif olarak işlendi. Basit dizin-sıralı kayıt organizasyonu, hızla daha güçlü bir set odaklı kayıt modeline dönüştü. Charles Bachmann, verileri tanımlamak ve verileri işlemek için standart bir dil geliştiren Veri Tabanı Görev Grubu'nun (DBTG) çalışmasına liderlik ettiği için Turing Ödülü'nü aldı. | |||
5031. | Veritabanı Geliştirme Kitaplığı | 11.72MB | |
Veritabanı tasarım teknolojisi. Varlıklar arasındaki ilişkileri tanımlama ve bir veri modeli oluşturma. Modern bilgi teknolojisinin ana fikirleri, değişen gerçek dünyayı yeterince yansıtmak ve kullanıcıların bilgi ihtiyaçlarını karşılamak için verilerin veritabanlarında düzenlenmesi gerektiği kavramına dayanmaktadır. Bu veri tabanları, DBMS veri tabanı yönetim sistemleri adı verilen özel yazılım sistemlerinin kontrolü altında oluşturulur ve çalıştırılır. | |||
13815. | Hiyerarşik Veri Tabanı Modeli | 81.62KB | |
Modern bilgi teknolojisinin ana fikirleri, bilgi teknolojisinin temelinin, belirli bir konu alanının durumunu yeterince yansıtan ve kullanıcıya bu konu alanında ilgili bilgileri sağlayan veritabanlarında düzenlenen veriler olduğu veritabanları kavramına dayanmaktadır. Kabul edilmelidir ki veriler... | |||
14095. | Kütüphane veritabanı geliştirme | 11.72MB | |
Depolanan verilerin hacmindeki ve yapısal karmaşıklığındaki artış, bilgi sistemleri kullanıcı çemberinin genişlemesi, en uygun ve nispeten anlaşılması kolay ilişkisel (tablo) VTYS'nin yaygın olarak kullanılmasına yol açmıştır. | |||
5061. | Poliklinik veri tabanının oluşturulması | 2.4MB | |
Bilgisayar teknolojisi ve bilgi teknolojisinin gelişmesi, çeşitli amaçlar için otomatik bilgi sistemlerinin (AIS) oluşturulması ve yaygın olarak kullanılması için fırsatlar sağlamıştır. Ekonomik ve teknik tesislerin yönetimi için bilgi sistemleri geliştirilmekte ve uygulanmaktadır. | |||
13542. | Jeolojik bilgi veritabanları | 20.73KB | |
Son zamanlarda, bilgisayar teknolojilerinin ve özellikle veri tabanlarının bilimsel alana girişi hızlı bir şekilde gerçekleşmektedir. Bu süreç jeolojiyi de atlamaz, çünkü doğa bilimlerinde büyük miktarda bilgiyi depolamaya ve işlemeye ihtiyaç vardır. | |||
9100. | Veri tabanı. Temel konseptler | 26.28KB | |
Bir veri tabanı, herhangi bir konu alanında, ekonomide, yönetimde, kimyada vb. gerçek dünyanın belirli nesneleri hakkında bir bilgi topluluğudur. Bir bilgi sisteminin amacı, yalnızca nesneler hakkında veri depolamak değil, aynı zamanda bu verileri manipüle etmektir. nesneler arasındaki ilişkileri dikkate alır. Her nesne, veritabanında öznitelikler olarak adlandırılan bir dizi veri özelliği ile karakterize edilir. | |||
5240. | "Üniversite Dekanlığı" veritabanının oluşturulması | 1.57MB | |
Bir veritabanı (DB), bir veya daha fazla uygulama için optimal bir şekilde kullanımlarına izin veren, böyle bir organizasyona ve minimum fazlalığa sahip bir bilgisayarın harici depolama ortamında birlikte depolanan birbiriyle ilişkili veriler topluluğudur. |
dersin amacı
Bu dersin materyalini inceledikten sonra şunları bileceksiniz:
ve öğren:
Herhangi bir veri ambarının özü, veri modelidir. Bir veri modeli olmadan, bir veri ambarındaki verileri düzenlemek çok zor olacaktır. Bu nedenle, DW geliştiricileri böyle bir model geliştirmek için zaman ve çaba harcamalıdır. HD modelinin gelişimi CD tasarımcısının omuzlarına düşüyor.
OLTP sistemlerinin tasarımı ile karşılaştırıldığında, bir veri ambarı tasarlama metodolojisi, depolama veri yapılarının analiz problemlerini çözmeye ve karar verme süreci için bilgi desteğine yönelik yönelimi ile ilgili bir dizi ayırt edici özelliğe sahiptir. Veri ambarının veri modeli, bu sorunlara etkin bir çözüm sağlamalıdır.
Bir veri ambarının tasarımındaki başlangıç noktası, sözde olabilir. kurumsal veri modeli(kurumsal veri modeli veya kurumsal veri modeli, EDM), bir kuruluşun OLTP sistemlerini tasarlama sürecinde oluşturulur. Tasarım yaparken kurumsal veri modeli genellikle, iş operasyonları temelinde, organizasyonun tüm bilgi ihtiyaçlarını toplayacak ve sentezleyecek böyle bir veri yapısı yaratmaya çalışılır.
Böylece, kurumsal veri modeli bir DW modeli oluşturmak için gerekli bilgileri içerir. Dolayısıyla ilk aşamada eğer organizasyonda böyle bir model varsa, bir veri ambarı tasarımcısı, bir dönüştürme problemini çözerek bir veri ambarı tasarlamaya başlayabilir kurumsal veri modeli HD modelinde.
Dönüştürme sorunu nasıl çözülür kurumsal veri modeli HD modelinde mi? Bu sorunu çözmek için bu modele sahip olmanız gerekir, yani. kurumsal veri modeli inşa edilmeli ve belgelenmiş. Ve anlaman gerek ne Bu modelden ve nasıl HD modele dönüştürülmelidir.
Konsepti netleştirelim kurumsal veri modeli. Altında kurumsal veri modeli Kuruluşun konu alanlarının çok seviyeli, yapılandırılmış bir tanımını, konu alanlarının veri yapılarını, iş süreçlerini ve iş prosedürlerini, kuruluşta benimsenen veri akışlarını, durum diyagramlarını, veri-süreç matrislerini ve kullanılan diğer model temsillerini anlayın. örgütün faaliyetleri. Böylece geniş anlamda, kurumsal veri modeli organizasyonun faaliyetlerini karakterize eden (bazı soyut düzeyde model) çeşitli düzeylerde bir dizi modeldir, yani. içerik kurumsal model doğrudan belirli bir organizasyonda hangi model yapıların dahil edildiğine bağlıdır.
Ana unsurlar kurumsal veri modelişunlardır:
Böylece, kurumsal veri modeli kuruluşun bilgi ihtiyaçlarını temsil eden varlıkları, nitelikleri ve ilişkileri içerir. Şek. 16.1 ana unsurları gösterir kurumsal veri modeli.
Kurumsal veri modeli, belirli iş ihtiyaçlarını desteklemekle ilgili varlık gruplarını temsil eden konu alanlarına göre alt bölümlere ayrılmıştır. Bazı konu alanları, sözleşme yönetimi gibi belirli iş fonksiyonlarını kapsayabilirken, diğerleri ürünleri veya hizmetleri tanımlayan işletmeleri gruplandırabilir.
Her mantıksal model, mevcut bir konu alanına karşılık gelmelidir. kurumsal veri modeli. Mantıksal model bu gereksinimi karşılamıyorsa, konu alanını tanımlayan bir model buna eklenmelidir.
Bir kurumsal veri modeli genellikle birkaç sunum katmanına sahiptir. Aslında yüksek seviye(yüksek seviye) kurumsal veri modeli kuruluşun ana konu alanlarının ve bunların kuruluş düzeyindeki ilişkilerinin bir açıklaması yer almaktadır. Şek. 16.2 bir parçadır kurumsal veri modeliÜst düzey.
Pirinç. 16.2.
Şekilde gösterilen şema dört konu alanını göstermektedir: "Müşteri" ( müşteri), "Kontrol" ( hesap), "Sipariş" ( sipariş) ve "Ürün" ( Ürün). Tipik olarak, model görünümünün en üst düzeyinde, yalnızca doğrudan bağlantılarörneğin, aşağıdaki gerçeği düzelten konu alanları arasında: alıcı, mal siparişi için faturayı öder. Bu düzeyde ayrıntılı bilgi ve dolaylı ilişkiler kurumsal model verilmez.
Bir sonrakinde orta seviye(orta seviye) kurumsal veri modeli konu alanlarının nesneleri hakkında ayrıntılı bilgileri gösterir, yani anahtarlar ve varlık özellikleri, ilişkileri, alt türleri ve üst türleri vb. Üst düzey modelin her alanı için bir orta düzey model vardır. Şek. 16.3, orta seviye sunumu gösterir kurumsal model"Sipariş" konu alanının bir parçası için.
Şek. 16.3 "Sipariş" konu alanının ( sipariş) nitelikleri ve aralarındaki ilişkiler aracılığıyla tanımlanan çeşitli varlıkları içerir. Sunulan model, siparişin tarihi, siparişi kimin verdiği, siparişi kimin gönderdiği, siparişi kimin aldığı ve daha birçok soruyu yanıtlamanıza olanak tanır. Yukarıdaki şemadan, bu organizasyonda iki tür sipariş olduğu görülebilir - bir reklam kampanyası için siparişler ( Reklam) ve perakende siparişler ( Perakende).
dikkat, ki kurumsal veri modeli organizasyonun faaliyetlerinin çeşitli yönlerini ve değişen derecelerde ayrıntı ve eksiksizliği temsil edebilir. Eğer kurumsal model organizasyonun tüm yönlerini temsil eder, aynı zamanda denir organizasyon veri modeli(kurumsal veri modeli).
Veri ambarı tasarlama açısından bakıldığında, veri ambarı modeli oluşturmaya karar vermede önemli bir faktör kurumsal veri modeli devlet mi tamlık kurumsal veri modeli.
Bir organizasyonun kurumsal veri modeli, evrimsel bir özelliğe sahiptir, yani. sürekli gelişiyor ve gelişiyor. Bazı konu alanları kurumsal veri modeli iyi gelişmiş olabilir, bazıları için henüz çalışma başlamamış olabilir. Konu alanının bir parçası üzerinde çalışılmamışsa kurumsal veri modeli, o zaman bu modeli bir veri ambarı tasarlamak için bir başlangıç noktası olarak kullanmanın bir yolu yoktur.
tamamlama derecesi kurumsal model HD tasarımında aşağıdaki gibi tesviye edilebilir. Bir veri ambarının geliştirilmesi genellikle zaman içinde bir dizi aşamaya bölündüğünden, tasarım süreci ile senkronize edilebilir. tamamlama süreci bireysel parçaların gelişimi kurumsal veri modeli kuruluşlar.
en düşük kurumsal veri modelinin sunum katmanı karşılık gelen veritabanı nesnelerinin fiziksel özellikleri hakkında bilgi görüntüler. mantıksal veri modeli orta kurumsal veri modelinin sunum katmanı.
BT uzmanları, giderek artan bir şekilde dikkatlerini endüstri standardı veri modelleri ve iş karar şablonlarına dayalı veri yönetimi çözümlerine çevirmektedir. Belirli faaliyet alanları için yüklenmeye hazır karmaşık fiziksel veri modelleri ve iş zekası raporları, kuruluşun bilgi bileşenini birleştirmenize ve iş süreçlerini önemli ölçüde hızlandırmanıza olanak tanır. Çözüm şablonları, hizmet sağlayıcıların mevcut sistemlerde gizlenen standart dışı bilgilerin gücünden yararlanmasına ve böylece proje zaman çizelgelerini, maliyetlerini ve risklerini azaltmasına olanak tanır. Örneğin, gerçek projeler, veri modeli ve iş karar şablonlarının geliştirme çabasını %50 oranında azaltabileceğini gösteriyor.
Bir endüstri mantıksal modeli, hem stratejik hem de taktiksel iş sorularını yanıtlamak için bir kurumsal veri ambarında olması gereken tüm bilgilerin alana özgü, entegre ve mantıksal olarak yapılandırılmış bir görünümüdür. Modellerin temel amacı, veri alanında yönlendirmeyi kolaylaştırmak ve iş geliştirme için önemli olan detayların vurgulanmasına yardımcı olmaktır. Günümüzün iş ortamında, çeşitli bileşenler arasındaki ilişkileri net bir şekilde anlamak ve organizasyonun büyük resmini iyi anlamak kesinlikle çok önemlidir. Modeller kullanılarak tüm detayların ve ilişkilerin tanımlanması, şirketin çalışmalarını organize etmek için zamanın ve araçların en verimli şekilde kullanılmasını sağlar.
Veri modelleri, verilerin nasıl temsil edildiğini ve erişildiğini açıklayan soyut modellerdir. Veri modelleri, belirli bir alanda veri öğelerini ve aralarındaki ilişkileri tanımlar. Veri modeli, belirli bir gerçek bilgi sınıfını doğru bir şekilde açıklamak için belirli bir dizi sembol ve kelime kullanan hem iş hem de BT uzmanları için bir gezinme aracıdır. Bu, organizasyon içindeki iletişimi geliştirir ve böylece daha esnek ve istikrarlı bir uygulama ortamı yaratır.
Yetkililer ve yerel özyönetim modeli için bir CBS örneği.
Bugün, yazılım ve hizmet sağlayıcıların teknolojik yenilikler, hükümet kısıtlamalarının kaldırılması ve tedarik zincirlerinin karmaşıklığı ile bağlantılı sektördeki değişikliklere hızlı bir şekilde yanıt verebilmesi stratejik olarak önemlidir. İş modelindeki değişikliklerle birlikte, şirketin faaliyetlerini desteklemek için gerekli olan bilgi teknolojisinin karmaşıklığı ve maliyeti artıyor. Veri yönetimi, kurumsal bilgi sistemlerinin ve bunların işlevsel ve iş gereksinimlerinin sürekli değiştiği bir ortamda özellikle zordur.
Bu süreci kolaylaştırmaya ve optimize etmeye yardımcı olmak için, BT yaklaşımını modern düzeye dönüştürmek için endüstri veri modellerinden yararlanılır.
Şirketten sektör veri modelleriEsri
Esri ArcGIS platformu için veri modelleri, CBS projelerinde kullanılmak ve çeşitli uygulama alanları için veri yapıları oluşturmak için çalışma şablonlarıdır. Bir veri modeli oluşturmak, daha sonra kişisel veya kurumsal bir coğrafi veritabanı oluşturmak için kullanılabilecek kavramsal bir tasarım, mantıksal yapı ve fiziksel yapı oluşturmayı içerir. ArcGIS, bir veritabanı şeması oluşturmak ve yönetmek için araçlar sağlar ve çeşitli uygulamalar ve endüstrilerde bir CBS projesini hızlı bir şekilde başlatmak için veri modeli şablonları kullanılır. Esri, kullanıcı topluluğuyla birlikte, kurumsal bir coğrafi veritabanı tasarlamaya hızla başlamanıza yardımcı olabilecek bir dizi şablon geliştirmek için önemli miktarda zaman harcamıştır. Bu projeler support.esri.com/datamodels adresinde açıklanmış ve belgelenmiştir. Aşağıda, bu sitede göründükleri sırayla Esri'nin endüstri modeli adlarının anlamsal çevirileri bulunmaktadır:
Bu modeller, endüstri standardının gerekli tüm özelliklerini içerir, yani:
Esri, PODS (Pipeline Open Data Standards - petrol ve gaz endüstrisi için açık bir standart; şu anda bir Esri PODS Esri Spatial olarak bir PODS uygulaması var) gibi kullanım için çeşitli endüstri modellerini öneren bağımsız kuruluşlardan oluşan uzman bir grubun parçasıdır. 5.1.1 coğrafi veritabanı) veya ArcGIS for Aviation'dan ICAO ve FAA önerilerinin yanı sıra AIXM 5.0 navigasyon veri değişim standardını dikkate alan bir coğrafi veritabanı (GDB). Ayrıca, S-57 ve ArcGIS for Maritime (deniz ve kıyı özellikleri) gibi mevcut endüstri standartlarına sıkı sıkıya bağlı olan önerilen modeller ve ayrıca Esri Professional Services'ın çalışmasından oluşturulan ve "fiili" standartlar olan modeller vardır. ilgili alanlarda. Örneğin, Ulus ve Yerel Yönetim için GIS, NSDI ve INSPIRE standartlarını etkilerken, Hidro ve Yeraltı Suyu, ücretsiz olarak temin edilebilen ArcHydro profesyonel paketinde ve ticari ürünlerinde yoğun olarak kullanılırken, üçüncü firmalar. Esri'nin NHDI gibi "fiili" standartları da desteklediğine dikkat edilmelidir. Önerilen tüm veri modelleri belgelenmiştir ve kurumsal BT süreçlerinde kullanıma hazırdır. Modellere eşlik eden malzemeler şunları içerir:
Esri, inşaat sektörü modelleri konusundaki deneyimini kitaplar şeklinde özetliyor ve yayınlanmış materyalleri yerelleştiriyor. Esri CIS aşağıdaki kitapları yerelleştirdi ve yayınladı:
Örneğin, kitap Dünyamızı modellemek..."(çeviri), genel olarak CBS veri modellemesine ve özel olarak coğrafi veritabanı veri modeline yönelik kapsamlı bir kılavuz ve referans kılavuzudur. Kitap, bir CBS projesinin her yönüyle ilgili kararları, doğru veri modelleme kararlarının nasıl alınacağını gösterir: veri tabanı tasarım verilerinden ve veri toplamadan mekansal analiz ve görselleştirmeye kadar Projeye uygun bir coğrafi veri tabanının nasıl tasarlanacağını, programlama olmadan veri tabanı işlevselliğinin nasıl kurulacağını, karmaşık projelerde iş akışının nasıl yönetileceğini, nehir, ulaşım gibi çeşitli ağ yapılarının nasıl modelleneceğini ayrıntılı olarak açıklar. veya elektrik ağları, uydu görüntü verilerini coğrafi analiz ve haritalamaya entegre edin ve 3B CBS veri modelleri oluşturun. Ulaşım için coğrafi veritabanları tasarlama" Çok sayıda projede test edilmiş ve Avrupa ve Amerika Birleşik Devletleri'nin yasal gerekliliklerinin yanı sıra uluslararası standartlara tam olarak uyan metodolojik yaklaşımları içerir. Ve kitapta " GIS: elektrik ve gaz işletmelerinin yeni enerjisi Gerçek dünya örneklerini kullanarak, müşteri hizmetleri, ağ işletimi ve diğer iş süreçleri gibi unsurlar dahil olmak üzere kurumsal bir CBS'nin bir enerji tedarikçisine getirebileceği faydaları gösterir.
Esri CIS ve DATA+ tarafından Rusça olarak yayınlanan tercüme edilmiş ve orijinal kitaplardan bazıları. Hem CBS teknolojisi ile ilgili kavramsal konuları hem de çeşitli ölçek ve amaçlarda CBS modelleme ve dağıtmanın birçok uygulamalı yönünü kapsar.
Örnek olarak BISDM (Bina İç Mekan Veri Modeli) sürüm 3.0 veri modelini kullanan endüstri modellerinin kullanımını ele alacağız. BISDM, daha genel bir BIM modelinin (Bina Bilgi Modeli, bina bilgi modeli) geliştirilmiş halidir ve bina ve yapıların tasarımında, inşasında, işletilmesinde ve hizmetten çıkarılmasında kullanılması amaçlanmıştır. CBS yazılımında kullanılır, coğrafi verileri diğer platformlarla etkili bir şekilde değiş tokuş etmenize ve onlarla etkileşime girmenize olanak tanır. Genel görev grubu FM'yi (kuruluş altyapı yönetimi) ifade eder. Kullanımına izin veren BISDM modelinin ana avantajlarını listeliyoruz:
BISDM, kullanım amacı ve türleri, kurulan iletişimler, kurulu ekipman, onarım ve bakımın muhasebeleştirilmesi, olayların kaydedilmesi, diğer şirket varlıklarıyla ilişkiler dahil olmak üzere bir binadaki iç tesisler düzeyinde mekansal verilerle çalışma kurallarını tanımlar. Model, coğrafi ve coğrafi olmayan verilerin birleşik bir deposunun oluşturulmasına yardımcı olur. Dünyanın önde gelen şirketlerinin deneyimi, varlıkları izole etmek ve hem binanın kendisini hem de içini oluşturan tüm fiziksel unsurların uzamsal ve mantıksal ilişkilerini GDB düzeyinde (jeodatabase) modellemek için kullanıldı. BISDM ilkelerini takip etmek, diğer sistemlerle entegrasyon görevlerini önemli ölçüde basitleştirmenize olanak tanır. İlk aşamada bu genellikle CAD ile entegrasyondur. Daha sonra binanın işletilmesi sırasında ERP ve EAM sistemleri (SAP, TRIRIGA, Maximo vb.) ile veri alışverişi yapılır.
ArcGIS kullanarak BISDM yapısal elemanlarının görselleştirilmesi.
BISDM kullanılması durumunda, müşteri/tesis sahibi, tesis oluşturma fikrinden komple bir proje geliştirmeye, inşaat kontrolüne kadar uçtan uca bilgi alışverişi alır. - Tesisin işletmeye alındığı zamana kadar tarih bilgisi, işletme sırasında ve hatta tesisin yeniden inşası veya hizmetten çıkarılması sırasında parametrelerin kontrolü. BISDM paradigmasının ardından, yardımıyla oluşturulan CBS ve GDB, ilgili sistemler için ortak bir veri deposu haline geldi. GDB'de genellikle üçüncü taraf sistemler tarafından oluşturulan ve işletilen veriler bulunur. Oluşturulan sistemin mimarisi tasarlanırken bu dikkate alınmalıdır.
Belirli bir aşamada, birikmiş "kritik bilgi kütlesi", yeni bir niteliksel düzeye geçmenizi sağlar. Örneğin, yeni bir binanın tasarım aşamasının tamamlanmasının ardından, CBS'de otomatik olarak 3D etüt modellerini görselleştirmek, kurulacak ekipman listesini derlemek, döşenecek mühendislik ağlarının kilometrelerini hesaplamak, bir dizi doğrulama yapmak mümkündür. ve hatta proje maliyetinin bir ön mali tahminini verin.
Bir kez daha, BISDM ve ArcGIS birlikte kullanıldığında, GDB bir kata ait z-koordinatları, eleman bağlantı türleri, ekipman dahil olmak üzere nesnenin eksiksiz bir tanımını içerdiğinden, biriken verilerden otomatik olarak 3B modeller oluşturmak mümkün hale gelir. kurulum yöntemleri, malzeme, mevcut yollar, personel hareketleri, her bir elemanın işlevsel amacı, vb. vb. Tüm tasarım malzemelerinin BISDM GDB'ye ilk aktarımından sonra, aşağıdakiler için ek içeriğe ihtiyaç duyulduğuna dikkat edilmelidir:
ArcGIS kullanımı sayesinde, harici kaynaklardan ek 3B nesnelerin ve referans kitaplarının içe aktarılması basitleştirilmiştir. ArcGIS Data Interoperability modülü, bu tür verileri içe aktarmak ve modele doğru şekilde yerleştirmek için prosedürler oluşturmanıza olanak tanır. IFC, AutoCAD Revit, Bentlye Microstation dahil olmak üzere sektörde kullanılan tüm formatlar desteklenmektedir.
IBM'den sektör veri modelleri
IBM, çeşitli sektörler için bir dizi depolama yönetimi aracı ve modeli sağlar:
örneğin, model IBMbankacılıkveParasalpazarlarVeriDepo veri açısından bankacılık sektörünün belirli zorluklarını ele almak için tasarlanmış ve IBMbankacılıkişlemveHizmetModeller- süreçler ve SOA (hizmet odaklı mimari) açısından. Telekomünikasyon endüstrisi için sunulan modeller IBMbilgiÇerçeve(IFW) Ve IBMTelekomünikasyonVeriDepo (TDW). Analitik sistemler oluşturma sürecini önemli ölçüde hızlandırmanın yanı sıra, telekomünikasyon endüstrisinin özelliklerini dikkate alarak iş zekası uygulamalarının geliştirilmesi, kurumsal veri yönetimi ve veri ambarlarının organizasyonu ile ilgili riskleri azaltmaya yardımcı olurlar. IBM TDW yetenekleri, kablolu ve kablosuz telefon hizmetleri, veri iletimi ve multimedya içeriği sunan İnternet sağlayıcıları ve kablolu ağ operatörlerinden telefon, uydu, uzun mesafe ve uluslararası iletişim hizmetleri sağlayan çok uluslu şirketlere kadar telekomünikasyon pazarının tüm yelpazesini kapsar. kuruluşlar küresel ağlar olarak. Bugün, TDW dünya çapında irili ufaklı kablolu ve kablosuz servis sağlayıcılar tarafından kullanılmaktadır.
denilen araç Müşteri İçgörüsü için InfoSphere Depo Paketi bankacılık, sigorta, finans, sağlık sigortası programları, telekomünikasyon, perakende ve dağıtım dahil olmak üzere artan sayıda iş projesi ve sektör için yapılandırılmış ve kolayca uygulanan bir iş içeriğidir. İş kullanıcıları için Pazar ve Kampanya İçgörüsü için InfoSphere Depo Paketi adım adım geliştirme ve işletmeye özel süreç yoluyla pazar istihbaratınızın ve pazarlama kampanyalarınızın etkinliğini en üst düzeye çıkarmanıza yardımcı olur. Üzerinden Tedarik Zinciri İçgörüsü için InfoSphere Depo Paketi organizasyonlar tedarik zinciri operasyonları hakkında güncel bilgi edinme yeteneğine sahiptir.
Esri'nin IBM çözüm mimarisi içindeki konumu.
Özellikle dikkat edilmesi gereken nokta, IBM'in kamu hizmetlerine ve kamu hizmeti şirketlerine yaklaşımıdır. Artan tüketici taleplerini karşılamak için kamu hizmeti şirketleri, bugün kullandıklarından daha esnek bir mimariye ve ayrıca serbest bilgi alışverişini kolaylaştıracak endüstri standardı bir nesne modeline ihtiyaç duyuyor. Bu, daha uygun maliyetli iletişimi mümkün kılarak enerji şirketlerinin iletişim yeteneklerini geliştirecek ve yeni sistemlere, kuruluş içinde nerede bulunurlarsa bulunsunlar, gerekli tüm kaynaklar için daha iyi görünürlük sağlayacaktır. Bu yaklaşımın temeli, departmanların işlevleri ile yeniden kullanılabilen çeşitli uygulamaların hizmetleri arasında bir yazışma oluşturan bir bileşen modeli olan SOA'dır (Hizmet Odaklı Mimari). Bu tür bileşenlerin "hizmetleri", kullanıcıdan arkalarındaki sistemlerin tüm karmaşıklığını gizleyerek, bağlayıcı olmadan arabirimler aracılığıyla iletişim kurar. Bu modda kuruluşlar, yazılım satıcısı, işletim sistemi, programlama dili veya yazılımın diğer dahili özelliklerinden bağımsız olarak yeni uygulamaları kolayca ekleyebilir. Konsept SOA temelinde uygulanır GÜVENLİ ( Enerji için Çözüm Mimarisi, kamu hizmeti endüstrisinin altyapılarına ilişkin standartlara dayalı, bütünsel bir görünüm kazanmasını sağlar.
Esri ArcGIS®, elektrik enerjisi, gaz iletimi, dağıtım ve telekomünikasyon ağlarının dijital varlıklarının oluşturulmasını ve yönetimini sağlayan coğrafi bilgi sistemleri (GIS) için dünya çapında tanınan bir yazılım platformudur. ArcGIS, mekansal konumlarını dikkate alarak elektrik dağıtım şebekesinin bileşenlerinin en eksiksiz envanterini yapmanızı sağlar. ArcGIS, akıllı şebekeyi yönetmek için gereken araçları, uygulamaları, iş akışlarını, analitiği ve bilgi ve bütünleştirme yeteneklerini sağlayarak IBM SAFE mimarisini büyük ölçüde genişletir. IBM SAFE içindeki ArcGIS, konumları hakkında doğru verilerle altyapı nesneleri, varlıklar, müşteriler ve çalışanlar hakkında çeşitli kaynaklardan bilgi edinmenin yanı sıra kurumsal varlıklar (sütunlar, boru hatları, teller, transformatörler, kablo kanalları vb.). GÜVENLİ bir altyapı içindeki ArcGIS, GIS, SCADA ve müşteri hizmetleri sistemlerinden gelen verileri trafik, hava koşulları veya uydu görüntüleri gibi harici bilgilerle birleştirerek önemli iş uygulamalarını dinamik olarak bağlamanıza olanak tanır. Kamu hizmetleri bu birleştirilmiş bilgileri C.O.R.'dan çeşitli amaçlar için kullanır. (operasyon ortamının büyük resmi) saha denetimleri, bakım, ağ analizi ve planlamasına kadar.
Bir güç kaynağı kuruluşunun bilgi bileşenleri, en düşük - fiziksel - en üst, en karmaşık iş süreci mantığı düzeyine kadar değişen çeşitli düzeyler kullanılarak modellenebilir. Bu katmanlar, otomatik ölçüm günlüğü ve denetleyici kontrol ve veri toplama (SCADA) kontrolü gibi tipik endüstri gereksinimlerini karşılamak için entegre edilebilir. SAFE mimarisini inşa ederek, kamu hizmeti şirketleri, Enerji ve Kamu Hizmetleri için Ortak Bilgi Modeli (CIM) adı verilen endüstri çapında bir açık nesne modelini geliştirmede önemli adımlar atıyorlar. Bu model, veri ve nesneleri yapılandırmak için açık standartların kullanımını teşvik ettiğinden, birçok işletmeyi hizmet odaklı bir mimariye taşımak için gerekli temeli sağlar. Tüm sistemlerin aynı nesneleri kullanmasını sağlayarak, aynı nesnelerin farklı uygulamalarıyla ilişkili karışıklık ve esneklik minimuma indirilecektir. Böylece, "müşteri" nesnesinin tanımı ve diğer önemli iş nesneleri, güç kaynağı şirketinin tüm sistemlerinde birleştirilmiş olacaktır. CIM ile, hizmet sağlayıcılar ve hizmet tüketicileri artık ortak bir veri yapısını paylaşabilir, bu da CIM bilgi paylaşımının oluşturulacağı ortak bir temel oluşturduğu için maliyetli iş bileşenlerini dışarıdan temin etmeyi kolaylaştırır.
Çözüm
Kapsamlı endüstri veri modelleri, şirketlere iş bilgilerinin tek ve entegre bir görünümünü sağlar. Çoğu şirket, verilerini entegre etmeyi zor bulmaktadır, ancak bu, kurumsal çaptaki çoğu proje için bir ön koşuldur. The Data Warehousing Institute (TDWI) tarafından yapılan bir araştırmaya göre, ankete katılan kuruluşların %69'undan fazlası, entegrasyonun yeni uygulamanın benimsenmesinin önünde önemli bir engel olduğunu buldu. Aksine, veri entegrasyonunun uygulanması şirkete maddi gelir ve artan verimlilik getiriyor.
İyi oluşturulmuş bir model, bu durumda yapılandırılmış veri olan verilerin anlamını benzersiz bir şekilde tanımlar (değerin belirsiz olabileceği görüntü, ikili dosya veya metin gibi yapılandırılmamış verilerin aksine). En etkili endüstri modelleri, Esri ve IBM dahil olmak üzere profesyonel satıcılar tarafından sunulmaktadır. Modellerinin kullanımındaki yüksek getiri, önemli düzeyde ayrıntı ve doğruluk nedeniyle elde edilir. Genellikle birçok veri özniteliği içerirler. Ek olarak, Esri ve IBM uzmanları, yalnızca kapsamlı modelleme deneyimine sahip olmakla kalmaz, aynı zamanda belirli bir sektör için model oluşturma konusunda da bilgilidir.
Bu makale, veri ambarlarının mimarisine odaklanacaktır. İnşa ederken neye rehberlik edilmelidir, hangi yaklaşımlar işe yarar - ve neden.
Masaldaki büyükbabamız ne karar verirse versin - yeni bir depolama tesisi inşa etmek veya mevcut olanı yeniden canlandırmaya çalışmak - tekrar “kollarımızı sıvamadan” sonuçlar çıkarmalıyız.
Bazı dar kapalı gruplarda uzmanlığa odaklanma tehlikesi, kontrol süreçlerinin eksikliği ve kuruluşta kullanılan sistemlerin mimarisinin şeffaflığının sağlanması gibi organizasyonel yönleri bir kenara bırakalım.
Bugün, belirli bir sistemin (veya sistem grubunun) - veri ambarlarının mimarisini oluşturmaya odaklanmak istiyorum. Bir kuruluş depolama gibi karmaşık ve pahalı bir sistem oluşturmaya başladığında ilk etapta nelere odaklanılmalıdır.
İlk olarak, depolarla çalışırken düzenli olarak karşılaştığımız tipik sorunları listeleyelim. Şimdi elimizdekileri yazalım - şu ana kadar düzene koymaya ve resmileştirmeye çalışmadan.
Bir süre sonra, resim aşağıdaki gibidir:
"İşte kasa. Ve dokunmazsanız çalışır. Bir şeyi değiştirmemiz gerektiğinde sorunlar ortaya çıkar.”
Bize etkisini değerlendiremediğimiz ve kavrayamadığımız bir değişiklik geliyor (çünkü bu tür araçları sisteme ilk başta koymadık) - ve risk almamak için olana dokunmuyoruz, bir tane daha yapıyoruz. yandaki uzantı ve bir tane daha ve daha fazlası - kararımızı gecekondu mahallelerine çevirmek ya da Latin Amerika'da dedikleri gibi, polisin bile gitmeye korktuğu "favelalar".
Kişinin kendi sistemi üzerinde kontrol kaybı hissi var, kaos. Mevcut süreçleri sürdürmek ve sorunları çözmek için giderek daha fazla el gerekiyor. Ve değişiklik yapmak giderek zorlaşıyor. Başka bir deyişle, sistem streslere karşı kararsız hale gelir, değişikliklere uyum sağlayamaz. Ayrıca, kimsenin bir "kartı" olmadığı için "faydalı yolu bilen" karakterlere güçlü bir bağımlılık vardır.
Bir nesnenin bu özelliği, kaos, rastgele olaylar ve karışıklıkların etkisi altında çökmektir - Nassim Nicholas Taleb diyor kırılganlık
. Aynı zamanda karşıt kavramı da sunar: anti-kırılganlık
– nesne stres ve kazalar tarafından yok edilmediğinde, ancak ondan doğrudan bir fayda aldığında. ("Antifrajilite. Kaostan nasıl yararlanılır")
Aksi takdirde çağrılabilir uyarlanabilirlik
veya değişime direnç
.
Bu, bu bağlamda ne anlama geliyor? BT sistemleri için "kaos kaynakları" nelerdir? Ve BT mimarisi açısından "kaostan yararlanmak" ne anlama geliyor?
Akla gelen ilk düşünce dışarıdan gelen değişimlerdir. Sistem için dış dünya nedir? Özellikle depolama için. Tabii ki, her şeyden önce - depo için veri kaynaklarından yapılan değişiklikler:
Depolama tüketicileri tarafından daha az kritik değişiklik başlatılmaz (gereksinim değişiklikleri):
Ama hepsi bu kadar değil.
Değişkenlikten bahsetmişken, her şeyden önce dış faktörleri hatırlıyoruz. Sonuçta, içimizde her şeyi kontrol edebiliyoruz, bize öyle geliyor değil mi? Evet ve hayır. Evet, etki alanı dışındaki faktörlerin çoğu dışsaldır. Ama bir de “iç entropi” var. Ve tam da onun varlığından dolayı bazen “0 noktasına” geri dönmemiz gerekiyor. Oyunu baştan başlatın.
Hayatta, genellikle sıfırdan başlama eğilimindeyiz. Neden bunu yapmaya meyilliyiz? Ve o kadar kötü mü?
BT'ye uygulandı. Sistemin kendisi için - bu çok iyi olabilir - bireysel kararları yeniden gözden geçirme yeteneği. Özellikle yerel olarak yapabileceğimiz zaman. Yeniden düzenleme, sistem geliştirme sürecinde periyodik olarak ortaya çıkan "ağ"ın çözülmesi sürecidir. "Başlangıca" dönmek faydalı olabilir. Ama bir bedeli var.
Uygun mimari yönetimi ile bu fiyat düşürülür ve sistem geliştirme sürecinin kendisi daha kontrol edilebilir ve şeffaf hale gelir. Basit bir örnek: modülerlik ilkesine uyulursa, harici arayüzleri etkilemeden ayrı bir modülü yeniden yazmak mümkündür. Ve bu monolitik bir yapı ile yapılamaz.
Bir sistemin kırılganlığı, mimarisi tarafından belirlenir. Ve onu uyarlanabilir yapan da bu özelliğidir.
hakkında konuştuğumuzda uyarlanabilir mimari- sistemin değişikliklere uyum sağlayabildiğini kastediyoruz ve mimarinin kendisini sürekli değiştirdiğimizden değil. Aksine, mimari ne kadar kararlı ve kararlı olursa, revizyonu gerektiren gereksinimler ne kadar az olursa, sistem o kadar uyarlanabilir.
Tüm mimarinin revizyonunu gerektiren çözümlerin fiyatı çok daha yüksek olacaktır. Ve evlat edinmeleri için çok iyi nedenleriniz olması gerekiyor. Örneğin böyle bir neden, mevcut mimari içerisinde uygulanamayan bir gereklilik olabilir. Sonra derler ki - mimariyi etkileyen bir gereklilik vardı.
Bu nedenle “antifrajilite sınırlarımızı” da bilmemiz gerekiyor. Mimari "bir boşlukta" geliştirilmemiştir - mevcut gereksinimlere ve beklentilere dayanmaktadır. Ve durum kökten değişirse - mevcut mimarinin ötesine geçtiğimizi anlamalıyız - ve onu revize etmemiz, farklı bir çözüm geliştirmemiz ve geçiş yolları üzerinde düşünmemiz gerekiyor.
Örneğin, günün sonunda her zaman depoda veriye ihtiyacımız olacağını varsaydık, standart sistem arayüzlerini kullanarak (bir dizi görünüm aracılığıyla) günlük olarak veri toplayacağız. Ardından risk yönetimi bölümünden verinin gün sonunda değil, kredi verme kararı alınırken alınması gerektiği yönünde talepler geldi. "Gerilmemiş olanı uzatmaya" gerek yok - sadece bu gerçeği kabul etmeniz gerekiyor - ne kadar erken olursa o kadar iyi. Ve sorunu çözmemizi sağlayacak bir yaklaşım üzerinde çalışmaya başlayın.
Burada çok ince bir çizgi var - sadece "andaki gereksinimleri" göz önünde bulundurursak ve birkaç adım ileriye (ve birkaç yıl sonrasına) bakmazsak, o zaman mimariyi etkileyen bir gereksinimle çok geç karşılaşma riskini artırırız - ve değişikliğimizin maliyeti çok yüksek olacak. Biraz ileriye bakmak - ufkumuz sınırları içinde - hiç kimseye zarar vermedi.
“Depolama peri masalından” bir sistem örneği, kırılgan tasarım yaklaşımları üzerine kurulmuş çok titrek bir sistem örneğidir. Ve eğer bu olursa, bu özel sistem sınıfı için yıkım oldukça hızlı gerçekleşir.
Neden böyle söyleyebilirim? Depolama konusu yeni değil. Bu süre zarfında geliştirilen yaklaşımlar ve mühendislik uygulamaları tam olarak bunu hedeflemiştir - sistemin yaşayabilirliğini korumak.
Basit bir örnek vermek gerekirse, kalkış depolama projelerinin başarısız olmasının en yaygın nedenlerinden biri, entegrasyon arayüzlerini eşleştirmeden geliştirilmekte olan kaynak sistemlerin üzerine depolama oluşturmaya çalışmaktır - doğrudan tablolardan veri çekmeye çalışmak. Sonuç olarak, geliştirme sürecine girdiler - bu süre zarfında kaynak veritabanı değişti - ve depolamadaki indirme akışları çalışamaz hale geldi. Bir şeyi yeniden yapmak için çok geç. Ve eğer deponun içinde birkaç kat masa yaparak kendinizi güvenceye almadıysanız, o zaman her şeyi atabilir ve baştan başlayabilirsiniz. Bu sadece bir örnek ve en basitlerinden biri.
Taleb'in kırılgan ve kırılmazlık kriteri basittir. Baş yargıç zamanı. Sistem zamanın testine dayanır ve "hayatta kalma" ve "yok edilemezliğini" gösterirse - kırılganlık özelliğine sahiptir.
Bir sistemi tasarlarken, bir gereklilik olarak anti-kırılganlığı hesaba katarsak, bu, bizi sistemin hem “dışarıdan kaosa” hem de “içten gelen kaosa” daha uyumlu hale getirecek mimarisini inşa etmek için bu tür yaklaşımları kullanmaya teşvik edecektir. ”. Ve nihayetinde sistem daha uzun bir ömre sahip olacaktır.
Hiçbirimiz "geçici" yapmak istemiyoruz. Ve şimdi başka bir yol olmadığı konusunda kendinizi kandırmayın. Bir insan için her an, özellikle kriz zamanlarında birkaç adım ileriye bakmak normaldir.
İnsanlar veri ambarlarının gerekli olduğu sonucuna nasıl vardı? Ve sadece "çok büyük bir veritabanından" nasıl farklılar?
Uzun zaman önce, dünyada sadece “iş veri işleme sistemleri” varken, BT sistemlerinin ön uç oltp sistemleri, arka ofis dss, metin veri işleme sistemleri, veri ambarları vb. sınıflara ayrılması yoktu. .
Bu, ilk ilişkisel DBMS Ingres'in Michael Stonebreaker tarafından yaratıldığı zamandı.
Ve bu, kişisel bilgisayarların çağının bilgisayar endüstrisine bir kasırga gibi girdiği ve o zamanın BT topluluğunun tüm fikirlerini sonsuza dek değiştirdiği zamandı.
O zaman Clipper, dBase ve FoxPro gibi masaüstü sınıfı DBMS temelinde yazılmış kurumsal uygulamaları bulmak kolaydı. Ve istemci-sunucu uygulamaları ve DBMS pazarı yalnızca ivme kazanıyordu. Birbiri ardına, BT alanındaki nişlerini uzun süre işgal edecek veritabanı sunucuları ortaya çıktı - Oracle, DB2, vb.
Ve "veritabanı uygulaması" terimi dolaşıma girdi. Böyle bir uygulama neleri içeriyordu? Basitleştirilmiş - kullanıcıların aynı anda bilgi girebileceği bazı girdi formları, "bir düğme üzerinde" veya "programa göre" başlatılan bazı hesaplamalar ve ayrıca ekranda görülebilen veya dosya olarak kaydedilip mühürlenmek üzere gönderilen bazı raporlar .
İlk akıl hocalarımdan biri "Özel bir şey yok - sadece basit bir uygulama, sadece bir veritabanı" dedi. "Özel bir şey yok mu?" - O zaman düşündüm.
Yakından bakarsanız, hala özellikler var. Kullanıcılar büyüdükçe, gelen bilgilerin hacmi artar, sistem üzerindeki yük arttıkça, geliştiricileri-tasarımcıları, performansı kabul edilebilir bir seviyede tutmak için bazı "hilelere" giderler. Birincisi, monolitik bir “iş veri işleme sisteminin”, kullanıcıların çevrimiçi modda çalışmasını destekleyen bir muhasebe uygulamasına ve toplu veri işleme ve raporlama için ayrı bir uygulamaya bölünmesidir. Bu uygulamaların her birinin kendi veritabanı vardır ve hatta farklı yük türleri - OLTP ve DSS için farklı ayarlarla, veritabanı sunucusunun ayrı bir örneğinde barındırılır. Ve veri akışları bunlar arasında oluşturulur.
Hepsi bu? Sorun çözülmüş gibi görünüyor. Sonra ne olur?
Ve sonra şirketler büyür, bilgi ihtiyaçları çoğalır. Dış dünyayla etkileşimlerin sayısı da artıyor. Sonuç olarak, tüm süreçleri tamamen otomatikleştiren büyük bir uygulama değil, farklı üreticilerden birkaç farklı uygulama var. Şirkette bilgi üreten sistemlerin sayısı - veri kaynağı sistemleri artıyor. Ve er ya da geç, farklı sistemlerden alınan bilgileri görme ve karşılaştırma ihtiyacı olacaktır. Şirkette yeni bir sistem sınıfı olan Veri Ambarı böyle ortaya çıkıyor.
Bu sistem sınıfının genel kabul görmüş tanımı aşağıdaki gibidir.
Veri Ambarı (veya Veri Ambarı)- bir kuruluşta karar vermeyi desteklemek için raporların ve iş analizinin hazırlanması için özel olarak tasarlanmış ve amaçlanan alana özgü bir bilgi veritabanıBöylece, konsolidasyon Farklı sistemlerden gelen veriler, onlara belirli bir "tek" (birleşik) şekilde bakabilme yeteneği, veri depolama sınıfı sistemlerinin temel özelliklerinden biridir. BT sistemlerinin evrimi sırasında depolamanın ortaya çıkmasının nedeni budur.
İlk olarak, bunlar büyük hacimlerdir. Çok büyük. VLDB - önde gelen satıcılar, ürünlerinin kullanımıyla ilgili tavsiyelerini verirken bu tür sistemleri böyle adlandırırlar. Şirketin tüm sistemlerinden veriler bu büyük veritabanına akar ve orada ders kitaplarında dedikleri gibi "sonsuza kadar ve değişmeden" saklanır (pratikte hayat daha karmaşık hale gelir).
İkincisi, tarihsel verilerdir - "Kurumsal hafıza" - sözde veri ambarları. Depoda zamanla çalışmak açısından her şey oldukça ilginç. Muhasebe sistemlerinde veriler şu anda önemlidir. Ardından kullanıcı bazı işlemler gerçekleştirir ve veriler güncellenir. Aynı zamanda, değişikliklerin geçmişi korunmayabilir - muhasebe uygulamasına bağlıdır. Örneğin, bir banka hesabı bakiyesi alın. Günün sonunda veya bir olay anındaki (örneğin, puanın hesaplandığı zaman) "şimdi" deki cari bakiyeyle ilgilenebiliriz. İlk ikisi oldukça basit bir şekilde çözülürse, ikincisi büyük olasılıkla özel çaba gerektirecektir. Depoyla çalışırken, kullanıcı geçmiş dönemlere erişebilir, bunları mevcut olanla karşılaştırabilir vb. Veri ambarlarını muhasebe sistemlerinden - zaman ekseninde çeşitli noktalarda verilerin durumunu elde etme - geçmişte belirli bir derinliğe kadar önemli ölçüde ayıran bu zamanla ilgili yeteneklerdir.
Üçüncüsü, bu konsolidasyon Ve veri birleştirme . Ortak analizlerini mümkün kılmak için onları ortak bir forma getirmek gerekir - birleşik veri modeli , gerçekleri birleşik referans kitaplarıyla karşılaştırın. Burada çeşitli yönler ve zorluklar olabilir. Her şeyden önce - kavramsal – aynı terim altında, farklı departmanlardan farklı kişiler farklı şeyleri anlayabilir. Ve tam tersi - temelde aynı şey olan bir şeyi farklı olarak adlandırmak. "Tek bir görünüm" nasıl sağlanır ve aynı zamanda belirli bir kullanıcı grubunun vizyonunun özellikleri nasıl korunur?
Dördüncüsü, onunla çalışmak veri kalitesi . Depoya veri yükleme sürecinde bunlar temizlenir, genel dönüşümler ve dönüşümler yapılır. Genel dönüşümler tek bir yerde yapılmalı ve ardından çeşitli raporlar oluşturmak için kullanılmalıdır. Bu, iş kullanıcıları için - özellikle de farklı departmanlardan birbiriyle uyuşmayan sayılarla masaya getirilen yönetim için - çok fazla tahrişe neden olan tutarsızlıkları önleyecektir. Kötü veri kalitesi, raporlarda hata ve tutarsızlıklara yol açar ve bunun sonucu olarak seviye düşer kullanıcı güveni tüm sisteme, bir bütün olarak tüm analitik hizmete.
Diyagramda gösterildiği gibi, kavramsal olarak aşağıdaki katmanları seçin. Veri depolama alanını (doldurulmuş bir dikdörtgenle gösterilir) ve veri yükleme yazılımını (koşullu olarak aynı renkteki oklarla gösterilir) içeren üç ana katman. Bununla birlikte, çok önemli bir bağlantı rolü oynayan bir yardımcı hizmet katmanının yanı sıra - veri yükleme ve kalite kontrolünü yönetmek.
Birincil Veri Katmanı - birincil veri katmanı
(veya evreleme
, veya işletim katmanı
) - kaynak sistemlerden yüklenecek ve birincil bilgileri, dönüşümler olmadan - orijinal kalitesinde ve eksiksiz bir değişiklik geçmişi desteği ile kaydedilecek şekilde tasarlanmıştır.
Bu katmanın görevi– veri kaynaklarının fiziksel cihazından sonraki depolama katmanlarını, veri toplama yöntemlerini ve değişikliklerin deltasını vurgulama yöntemlerini soyutlamak.
Çekirdek Veri Katmanı - depolama çekirdeği
- depolamayı yalnızca bir "toplu entegrasyon platformundan" veya bir "büyük veri dökümünden" ayıran sistemin merkezi bileşeni, çünkü ana rolü veri konsolidasyonu farklı kaynaklardan, tek tip yapılara indirgeme, anahtarlar. Çekirdeğe yüklenirken, veri kalitesi ve genel dönüşümlerle ilgili ana çalışma, oldukça karmaşık olabilen gerçekleştirilir.
Bu katmanın görevi- tüketicilerini veri kaynaklarının mantıksal yapısının özelliklerinden ve farklı sistemlerden gelen verileri karşılaştırma ihtiyacından soyutlamak, verilerin bütünlüğünü ve kalitesini sağlamak.
Data Mart Katmanı - analitik vitrinler
- ana işlevi, verileri analiz için uygun yapılara dönüştürmek olan bir bileşen (BI, vitrinlerle çalışıyorsa, bu genellikle boyutlu bir modeldir) veya tüketici sisteminin gereksinimlerine göre.
Kural olarak, veri marketleri - güvenilir ve doğrulanmış bir kaynak olarak - yani çekirdekten veri alır. verileri tek bir forma getirmek için bu bileşenin hizmetini kullanın. Bu tür pencereleri arayacağız düzenli
. Bazı durumlarda, vitrinler verileri doğrudan hazırlamadan alabilir - birincil verilerle çalışır (kaynak anahtarlarında). Bu yaklaşım, kural olarak, farklı sistemlerden veri konsolidasyonunun gerekli olmadığı ve veri kalitesinden daha fazla verimliliğin gerekli olduğu yerel görevler için kullanılır. Bu tür görüntüler denir işletme
. Bazı analitik göstergeler çok karmaşık hesaplama yöntemlerine sahip olabilir. Bu nedenle, bu tür önemsiz olmayan hesaplamalar ve dönüşümler için sözde ikincil vitrinler
.
Vitrin katmanı görevi– belirli bir tüketicinin – bir BI platformu, bir grup kullanıcı veya harici bir sistemin – gereksinimlerine göre verilerin hazırlanması.
Yukarıda açıklanan katmanlar, kalıcı bir veri depolama alanının yanı sıra verileri yüklemek ve dönüştürmek için bir yazılım modülünden oluşur. Bu katmanlara ve bölgelere ayırma mantıklıdır. Bu bileşenlerin fiziksel uygulaması farklı olabilir - daha verimli ise, verileri farklı katmanlarda depolamak veya dönüştürmek için farklı platformlar bile kullanabilirsiniz.
Depolama alanları, veri dönüştürme sürecinde kullanılan teknik (arabellek tabloları) ve hedef tablolar, tüketici bileşeni tarafından erişilen. Hedef tabloları görünümlerle "örtmek" iyi bir uygulamadır. Bu, sistemin daha sonraki bakımını ve geliştirilmesini kolaylaştırır. Her üç katmanın da hedef tablolarındaki veriler, veri yükleme işlemlerini sağlamaya ve ayrıca depolamadaki veri akışlarının bilgi denetimini sağlamaya yarayan özel teknik alanlar (meta-öznitelikler) ile işaretlenmiştir.
Tüm katmanlar için hizmet işlevleri sağlayan özel bir bileşen (veya bileşen grubu) da ayırt edilir. Anahtar görevlerinden biri - kontrol işlevi - tüm sistem için bir bütün olarak "oyunun tek kurallarını" sağlamak ve yukarıda açıklanan katmanların her birini uygulamak için farklı seçenekler kullanma hakkını bırakmaktır - dahil. verileri yüklemek ve işlemek için farklı teknolojiler, farklı depolama platformları vb. kullanın. onu arayalım hizmet katmanı (Hizmet Katmanı) . İş verilerini içermez, ancak kendi depolama yapılarına sahiptir - bir meta veri alanının yanı sıra veri kalitesiyle çalışmak için bir alan (ve kendisine atanan işlevlere bağlı olarak muhtemelen diğer yapılar) içerir.
Sistemin ayrı bileşenlere bu kadar net bir şekilde bölünmesi, sistem geliştirmenin kontrol edilebilirliğini önemli ölçüde artırır:
Bu bileşenin varlığı, aynı işlevin uygulanmasını her uygulama mağazası için ayrı ayrı tekrarlamak yerine, kaynak sistemlerden alınan birincil verileri ortak kurallar ve algoritmalar izleyerek tek bir biçime dönüştüren veri akışlarını yeniden kullanmanıza olanak tanır. kaynakların verimsiz kullanımı, verilerde de tutarsızlıklara yol açabilir.
Depolama çekirdeği, genel durumda, hem kaynak sistem modellerinden hem de tüketicilerin biçimlerinden ve yapılarından farklı bir veri modelinde uygulanır.
Efsane 1.
Kurumsal veri modeli, binlerce varlıktan (tablo) oluşan devasa bir modeldir.
Aslında.
Herhangi bir konu alanında, herhangi bir iş alanında, herhangi bir şirketin verilerinde, en karmaşık bile olsa, birkaç temel varlık vardır - 20-30.
Efsane 2.
Herhangi bir "kendi modeli" geliştirmeye gerek yok - bir endüstri referans modeli satın alıyoruz - ve her şeyi buna göre yapıyoruz. Para harcıyoruz - ama garantili bir sonuç alıyoruz.
Aslında.
Referans modeller gerçekten çok faydalı olabilir, çünkü. Bu alanı modellemede endüstri deneyimi içerir. Onlardan fikirler, yaklaşımlar, adlandırma uygulamaları çizebilirsiniz. Önemli bir şeyi kaçırmamak için alanın "kapsam derinliğini" kontrol edin. Ancak böyle bir modeli "kutudan çıktığı gibi" kullanmamız pek mümkün değil - olduğu gibi. Bu, örneğin, bir ERP sistemi (veya CRM) satın almak ve onu “kendi başınıza çevirmeden” uygulamakla aynı efsanedir. Bu tür modellerin değeri, bu belirli işin, bu belirli şirketin gerçeklerine uyarlanmalarında doğar.
Efsane 3.
Depolama çekirdek modelinin geliştirilmesi aylar alabilir ve bu süre zarfında proje gerçekten dondurulacaktır. Buna ek olarak, çılgın miktarda toplantı ve birçok insanın katılımını gerektirir.
Aslında.
Depo modeli, depo ile birlikte parça parça yinelemeli olarak geliştirilebilir. Kaplanmamış alanlar için "uzatma noktaları" veya "saplamalar" yerleştirilir - yani. bazı "evrensel yapılar" uygulanmaktadır. Aynı zamanda, hem "veri koymanın" hem de (daha da zor) elde etmenin zor olduğu 4 tablodan oluşan süper evrensel bir şey almamak için önlemi bilmeniz gerekir. Ve performans açısından son derece uygun olmayan bir durum.
Modeli geliştirmek zaman alacaktır. Ancak bu, “varlıkların çizilmesi” için harcanan zaman değildir - bu, konu alanını analiz etmek, verilerin nasıl yapılandırıldığını anlamak için gereken zamandır. Bu nedenle analistler bu sürece çok yakından dahil oluyor ve çeşitli iş uzmanları da dahil oluyor. Ve bu seçici olarak yapılır. Ve çok sayıda insanla toplantılar düzenleyerek, büyük anketler göndererek vb.
Kaliteli iş ve sistem analizi, bir depolama çekirdek modeli oluşturmanın anahtarıdır. Pek çok şeyi anlamanız gerekir: verilerin nerede (hangi sistemlerde) üretildiği, nasıl düzenlendiği, hangi iş süreçlerinde dolaştığı vb. Nitel analiz hiçbir sisteme zarar vermemiştir. Aksine, problemler anlayışımızdaki “boş noktalardan” kaynaklanmaktadır.
Bir veri modeli geliştirmek, yeni bir şey icat etme ve ortaya çıkarma süreci değildir. Aslında, şirketteki veri modeli zaten var. Ve tasarım süreci daha çok "kazılar" gibidir. Model, kurumsal verilerin "zemininden" nazikçe ve dikkatli bir şekilde gün ışığına çıkarılır ve yapılandırılmış bir forma bürünür.
Efsane 4.
Şirketimizde iş o kadar dinamik ki ve her şey o kadar hızlı değişiyor ki, bir model yapmak bizim için işe yaramaz - sistemin bu bölümünü devreye almadan önce modası geçmiş olacak.
Aslında.
Çekirdekteki kilit faktörün istikrar olduğunu hatırlayın. Ve hepsinden önemlisi, modelin topolojisi. Niye ya? Çünkü merkezi olan ve diğer her şeyi etkileyen bu bileşendir. Kararlılık, çekirdek modeli için de bir gerekliliktir. Model çok hızlı bir şekilde eski hale gelirse, yanlış tasarlanmıştır. Gelişimi için yanlış yaklaşımlar ve “oyunun kuralları” seçilmiştir. Bu aynı zamanda bir niteliksel analiz sorunudur. Kurumsal modelin kilit unsurları çok nadiren değişir.
Ama aklımıza “Ürünler” dizini yerine, örneğin şekerleme satan bir firma için “Tatlılar”, “Pastalar” ve “Börekler” yapmak geliyorsa. Ardından, mal listesinde pizza göründüğünde - evet, birçok yeni tablo girmeniz gerekecek. Ve bu sadece bir yaklaşım meselesi.
Efsane 5.
Kurumsal bir model oluşturmak çok ciddi, karmaşık ve sorumlu bir iştir. Ve hata yapmak korkutucu.
Aslında.
Çekirdek model, kararlı olmasına rağmen, hala “metalden dökülmüş” değildir. Diğer tasarım kararları gibi, yapısı da gözden geçirilebilir ve değiştirilebilir. Sadece onun bu kalitesini unutma. Ancak bu, üzerinde “nefes alamayacağınız” anlamına gelmez. Ve bu, işleme için planlanması gereken geçici çözümlerin ve "saplamaların" kabul edilemez olduğu anlamına gelmez.
Efsane 6.
Bir veri kaynağımız varsa - örneğin, bir NSI sistemi (veya bir ana veri yönetim sistemi - MDM), o zaman kurumsal modele iyi bir şekilde karşılık gelmelidir (özellikle yakın zamanda tasarlanmışsa ve satın almak için zamanı yoksa). “yan etkiler”, “gelenekler” ve geçici binalar). Görünüşe göre bu durumda - bir çekirdek modeline ihtiyacımız yok mu?
Aslında.
Evet, bu durumda, depolama çekirdek modelinin yapımı büyük ölçüde kolaylaştırılmıştır - çünkü üst düzey hazır bir kavramsal model izliyoruz. Ama hiç de dışlanmıyor. Niye ya? Çünkü belirli bir sistemin modelini oluştururken, belirli kurallar geçerlidir - ne tür tablolar kullanılacak (her varlık için), verilerin nasıl sürümlendirileceği, geçmişi hangi ayrıntı düzeyinde tutulacağı, hangi meta nitelikler (kullanılacak teknik alanlar), vb. .
Ek olarak, sahip olduğumuz NSI ve MDM sistemi ne kadar harika ve kapsamlı olursa olsun, kural olarak, diğer muhasebe sistemlerinde “yaklaşık aynı” yerel dizinlerin varlığıyla ilgili nüanslar olacaktır. Ve bu sorun, hoşumuza gitsin ya da gitmesin, depoda çözülmek zorunda kalacak çünkü raporlama ve analizler burada toplanıyor.
Bu katmandaki veriler, birincil verileri mümkün olduğunca orijinal biçimlerine yakın tutmak için kaynak sisteme mümkün olduğunca yakın yapılarda saklanır. Bu bileşenin bir diğer adı da "operasyonel katman"dır.
Neden yerleşik “evreleme” terimini kullanmıyorsunuz? Gerçek şu ki, daha önce, "büyük veri ve VLDB çağından" önce, disk alanı çok pahalıydı - ve genellikle birincil veriler, eğer saklanırsa, yalnızca sınırlı bir süre içindi. Ve genellikle "evreleme" adı denir temizlenebilir tampon.
Şimdi, teknoloji bir adım öne çıktı - ve yalnızca tüm birincil verileri saklamayı değil, aynı zamanda onları yalnızca mümkün olan ayrıntı düzeyiyle tarihselleştirmeyi de karşılayabiliyoruz. Bu, verilerin büyümesini kontrol etmememiz gerektiği anlamına gelmez ve kullanım "sıcaklığına" bağlı olarak veri depolama maliyetini optimize ederek bilgi yaşam döngüsünü yönetme ihtiyacını ortadan kaldırmaz - yani. daha az talep gören "soğuk veri"nin daha ucuz medya ve depolama platformlarına taşınması.
Bize "tarihi sahneleme"nin varlığını veren şey:
İkincisi, görünüşe göre, bu süreçler çok basit bir şekilde düzenlenmiştir - mantık açısından önemsiz olarak söylenebilir. Bu da, sistemimizdeki yükü azaltarak ve kaynakları bağlama sürecini hızlandırarak (geliştirme süresi) çok iyi optimize edilip parametrelendirilebilecekleri anlamına gelir.
Bunun olması için, bu bileşenin çalıştığı platformun teknolojik özelliklerini çok iyi bilmeniz gerekir - ve sonra çok etkili bir araç yapabilirsiniz.
Tüketici harici bir sistemse, kural olarak, ihtiyaç duyduğu veri yapılarını ve bilgi toplama kurallarını belirler. İyi bir yaklaşım, tüketicinin doğru veri toplamadan sorumlu olduğu yaklaşımdır. Hazırlanan veri ambarı, vitrini oluşturdu, artımlı veri toplama olanağı sağladı (sonraki delta değişikliklerinin seçimi için meta niteliklerle işaretleme) ve daha sonra tüketici sistemi bu vitrini nasıl kullandığını yönetir ve bundan sorumludur. Ancak bazı özellikler vardır: Sistemde veri toplama için aktif bir bileşen olmadığında, ya bir bütünleştirme işlevi görecek harici bir bileşene ihtiyaç duyulur ya da depolama, bir "entegrasyon platformu" olarak hareket edecek ve doğru artımlı veri yüklemesini sağlayacaktır. ayrıca – depolamanın dışında. Burada birçok nüans ortaya çıkıyor ve arayüz etkileşiminin kuralları her iki taraf tarafından da düşünülmeli ve anlaşılmalıdır (ancak, her zaman olduğu gibi, entegrasyon söz konusu olduğunda). Kural olarak, bu tür vitrinlere verilerin rutin olarak temizlenmesi/arşivlenmesi uygulanır (bu “geçiş verilerinin” uzun süre saklanması nadiren gereklidir).
Analitik görevler açısından en büyük önemi, "insanlar için" - daha doğrusu birlikte çalıştıkları BI araçları için - vitrinlerdir.
Bununla birlikte, harici özel sistemleri doldurmak için ne BI araçlarına ne de rutin işlemlere ihtiyaç duymayan "özellikle ileri düzey kullanıcılar" - analistler, veri bilimciler - kategorisi vardır. Kendi takdirine bağlı olarak tablolar ve dönüşümler oluşturabilecekleri bir tür "ortak vitrin" ve "kendi sanal alanına" ihtiyaçları var. Bu durumda arşivin sorumluluğu, bu ortak data martların mevzuata uygun olarak doldurulmasını sağlamaktır.
Ayrı olarak, Veri Madenciliği araçları - derin veri analizi gibi tüketicileri ayırabiliriz. Bu araçların kendi veri hazırlama gereksinimleri vardır ve veri bilimcileri tarafından da kullanılır. Depo için, görev azaltılmıştır - yine, üzerinde anlaşmaya varılmış bir formattaki belirli vitrinleri indirmek için hizmeti desteklemek.
Ancak, analitik vitrinlere geri dönelim. Bu veri katmanında depolama tasarımcıları açısından ilgi çekici olan onlardır.
Bana göre, neredeyse tüm BI platformlarının artık “keskinleştirilmiş” olduğu veri marketlerini tasarlamak için zamana göre test edilmiş en iyi yaklaşım, Ralph Kimball'un yaklaşımıdır. O isimle tanınır boyutlu modelleme
– çok boyutlu modelleme. Bu konuda çok sayıda yayın var. Örneğin, temel kurallar Marga Ross'un yayınında bulunabilir. Ve tabii ki çok değişkenli modellemenin gurularından tavsiyelerde bulunabilirsiniz. Bir başka yararlı kaynak da Kimball's Tips.
Mağaza vitrinleri yaratmaya yönelik çok boyutlu yaklaşım, hem yöntem savunucuları hem de önde gelen yazılım satıcıları tarafından o kadar iyi tanımlanmış ve işlenmiştir ki, burada herhangi bir ayrıntı üzerinde durmanın bir anlamı yoktur - orijinal kaynak her zaman tercih edilir.
Tek bir vurgu yapmak istiyorum. "Raporlama ve analitik" farklıdır. "Ağır raporlama" var - dosya şeklinde oluşturulan ve sağlanan dağıtım kanalları aracılığıyla kullanıcılara teslim edilen önceden sipariş edilmiş raporlar. Ve bilgi panelleri var - BI panoları. Temel olarak, bunlar web uygulamalarıdır. Ve bu uygulamaların yanıt süresi gereksinimleri, diğer herhangi bir web uygulamasıyla aynıdır. Bu, BI paneli için normal yenileme süresinin dakika değil, saniye olduğu anlamına gelir. Bir çözüm tasarlarken bunu akılda tutmak önemlidir. Buna nasıl ulaşılır? Standart optimizasyon yöntemi: Tepki süresinin nelerden oluştuğuna ve neleri etkileyebileceğimize bakarız. En çok neye zaman harcıyorsun? Veritabanının fiziksel (disk) okuması, ağ üzerinden veri aktarımı için. İstek başına okunan ve iletilen veri miktarı nasıl azaltılır? Cevap açık ve basittir: ya verileri toplamanız ya da sorguya katılan büyük olgu tablolarına bir filtre uygulamanız ve büyük tabloların birleşimini hariç tutmanız gerekir (olgu tablolarına yapılan referanslar yalnızca boyutlardan geçmelidir).
BI ne için? Nasıl uygun? Çok değişkenli model neden etkilidir?
BI, kullanıcının sözde "ad hoc sorguları" gerçekleştirmesine izin verir. Bunun anlamı ne? Bu, talebi önceden tam olarak bilmediğimiz, ancak kullanıcının hangi bölümlerde hangi göstergeleri talep edebileceğini bildiğimiz anlamına gelir. Kullanıcı, uygun BI filtrelerini seçerek böyle bir sorgu oluşturur. İş zekası geliştiricisinin ve vitrin tasarımcısının görevi, çok fazla verinin istendiği ve uygulamanın "askıda kaldığı" bir durumdan kaçınarak, verilerin filtrelenmesi veya toplanması için böyle bir uygulama işlem mantığı sağlamaktır. Genellikle toplu rakamlarla başlarlar, ardından daha ayrıntılı verilere girerler, ancak bu arada gerekli filtreleri ayarlarlar.
Sadece "doğru yıldızı" oluşturmak ve BI için uygun bir yapı elde etmek her zaman yeterli değildir. Bazen denormalizasyonu bir yere (yükü nasıl etkileyeceğine bakarken) ve ikincil vitrinler ve kümeler yapmak için bir yere uygulamanız gerekir. İndeksler veya projeksiyonlar eklenecek bir yer (DBMS'ye bağlı olarak).
Böylece, “deneme yanılma” yoluyla, hem DBMS hem de BI platformunun özelliklerini ve ayrıca kullanıcının veri sunumu gereksinimlerini dikkate alacak olan BI için en uygun yapıyı elde edebilirsiniz.
"Çekirdekten" veri alırsak, doğrudan kaynak sistemlerden alınan birincil verilerin karmaşık işlenmesini etkilemeden vitrinlerin bu tür işlenmesi yerel nitelikte olacaktır - verileri yalnızca BI için uygun bir biçime "kaydırırız". Ve bunu birçok kez, farklı şekillerde, farklı gereksinimlere göre yapmayı göze alabiliriz. Bunu çekirdek verileri temelinde yapmak, "birincil" (yapısı ve kuralları, bildiğimiz gibi, "yüzebilir") derlemekten çok daha kolay ve hızlıdır.
Bu katman iki veri depolama alanı içerir:
Yük yönetiminde önemli bir nokta, hata işlemeye yönelik birleşik bir yaklaşımın geliştirilmesidir. Hatalar kritiklik düzeyine göre sınıflandırılır. Kritik bir hata oluştuğunda, işlem durdurulmalı ve mümkün olan en kısa sürede, çünkü. oluşumu, depolamada veri bozulmasına yol açabilecek önemli bir sorunu gösterir. Bu nedenle, yük yönetimi sadece süreçleri başlatmakla kalmaz, aynı zamanda onları durdurmak ve zamansız (yanlışlıkla) başlatmayı önlemekle ilgilidir.
Servis katmanının çalışması için özel bir metadata yapısı oluşturulur. Bu alan, yükleme işlemleri, yüklenen veri kümeleri, artışı sürdürmek için kullanılan kontrol noktaları (hangi işlemin hangi noktaya kadar okuduğu) ve sistemin çalışması için gerekli diğer hizmet bilgileri hakkında bilgileri depolayacaktır.
Tüm katmanlardaki tüm hedef tabloların, biri bu dizeyi güncelleyen işlemin kimliği olan özel bir meta-alan seti ile işaretlendiğini unutmamak önemlidir. Bir havuz içindeki tablolar için, bu süreç işaretlemesi, sonradan delta değişikliklerini çıkarmak için birleşik bir yol sağlar. Birincil veri katmanına veri yüklerken durum daha karmaşıktır - yüklenen farklı nesneler için delta çıkarma algoritması farklı olabilir. Öte yandan, kabul edilen değişiklikleri işlemenin mantığı ve çekirdek ve vitrinler için hedef tablolara yuvarlanma mantığı, her şeyin oldukça önemsiz olduğu aşamaya göre çok daha karmaşıktır - yeniden kullanılabilir tipik adımları parametreleştirmek ve düşünmek kolaydır ( prosedürler).
Buradaki görevi tam olarak bu konuyu kapsayacak şekilde belirlemedim - yükleme organizasyonu - sadece dikkat edilmesi gereken aksanları koyuyorum.
Yukarıdaki yaklaşım seçeneklerden sadece biridir. O oldukça uyarlanabilir. Ve onun "kavramsal prototipi" Toyota konveyörü ve "tam zamanında" sistemiydi. Onlar. Sadece "gecelik veri yükleme" yaygın paradigmasından uzaklaşıyoruz ve gün boyunca küçük porsiyonlar halinde yükleme yapıyoruz - çünkü veriler çeşitli kaynaklarda hazır: gelen, yüklenendir. Aynı zamanda, çalışan birçok paralel işlemimiz var. Ve yeni verilerin "sıcak kuyruğu" sürekli olarak "yanıp söner" - ve hatta bir süre sonra söner. Bu özelliği dikkate almalıyız. Ve gerekirse, her şeyin zaten ayrılmaz olduğu özel vitrinler "dilimler" oluşturmak için. Onlar. aynı anda hem verimlilik hem de tutarlılık (bütünlük) elde etmek imkansızdır. Bir dengeye ihtiyacımız var - bir yerde bir şey önemli, başka bir yerde.
Günlüğe kaydetme ve izleme araçları sağlamak son derece önemlidir. İyi bir uygulama, farklı parametreler ayarlayabileceğiniz ve bir bildirim sistemi - belirli olaylara abonelik - kurabileceğiniz yazılı olayları kullanmaktır. Çünkü sistem yöneticisinin müdahalesi gerektiğinde, bunu mümkün olan en kısa sürede bilmesi ve gerekli tüm teşhis bilgilerini alması çok önemlidir. Günlükler, olay sonrası sorun analizi için ve ayrıca sistem arızaları olaylarını araştırmak için de kullanılabilir. veri kalitesi.
Modelsiz anlamak mümkün mü? Temel olarak, yapabilirsiniz. Ve bunu anlamak ve "bir kağıt parçası üzerindeki resimleri tahmin etmek" ve verileri "süpürmek - yerleştirmek" için. Ancak hazır bir yapıyı - bir veri modelini - kullanmak çok daha kolay, daha net ve daha hızlıdır. Ve ayrıca “yapısının mantığını” anlamak için - yani. Oyunun ortak kurallarının olması güzel olurdu.
Ve en önemli şey o bile değil. En önemlisi, bir model tasarlarken, (sadece seçenekler olmadan!) Konu alanını, veri yapısının özelliklerini ve çeşitli iş durumlarında kullanımlarını daha yakından ve derinlemesine incelemek zorunda kalıyoruz. Karmaşık diye kolayca “bir kenara iteceğimiz”, işaretlerimizi atarak “bulanıklaştırdığımız” sorular, tasarım modeli - analiz ve tasarım sırasında ve daha sonra değil - raporlar oluşturduğumuzda ve “uyumsuzları nasıl azaltacağımızı” ve her seferinde “tekerleği yeniden icat ettiğimizi” düşündüğümüzde şimdi belirlemek ve karar vermek zorunda kalacağız.
Bu yaklaşım, kırılmaz sistemler oluşturmayı mümkün kılan mühendislik uygulamalarından biridir. Açıkça düzenlenmiş, şeffaf, geliştirmesi kolay ve "kırılganlık sınırları" hemen görülebildiği için, yeni gereksinimler ortaya çıktığında ve yeniden tasarım için gereken süre (gerekirse) için "felaketin ölçeği" daha doğru bir şekilde değerlendirilebilir. .
Bu nedenle, veri modeli, sistemin geliştirilmesi sırasında korunması gereken ana eserlerden biridir. İyi bir şekilde, her analist, geliştirici vb. için “masada” olmalıdır. – sistem geliştirme projelerinde yer alan herkes.
Veri modelleri tasarlamak ayrı, çok kapsamlı bir konudur. Depolama tasarımına iki ana yaklaşım vardır.
Yaklaşım çekirdek için iyidir "varlık-ilişki"
- konu alanı, daha doğrusu seçilen alanı temel alınarak normalleştirilmiş bir (3NF) model oluşturulduğunda. Burada yukarıda tartışılan aynı “kurumsal model” oynuyor.
Analitik vitrinler tasarlanırken uygun çok boyutlu model . Bu yaklaşım, iş kullanıcılarının anlayışına çok uygundur. bu, insan algısı için basit ve kullanışlı bir modeldir - insanlar, metriklerin (göstergelerin) anlaşılır ve tanıdık kavramları ve analiz edildikleri bölümlerle çalışır. Ve bu, gereksinimleri toplama sürecini basit ve net bir şekilde oluşturmamızı sağlar - çeşitli departman temsilcileriyle iletişim kurarak bir dizi "kesme ve gösterge matrisi" çizeriz. Ve sonra onu tek bir yapıya getiriyoruz - “analiz modeli”: “ölçüm veriyolu”nu oluşturuyoruz ve üzerlerinde tanımlanan gerçekleri belirliyoruz. Bu arada, hiyerarşiler ve toplama kuralları üzerinde çalışıyoruz.
Ayrıca, VTYS'nin özelliklerini dikkate alarak optimizasyon öğeleri ekleyerek fiziksel modele geçmek çok kolaydır. Örneğin, Oracle için bölümleme, bir dizi dizin vb. Vertica için diğer teknikler kullanılacaktır - sıralama, segmentasyon, bölümleme.
Özel denormalizasyon da gerekli olabilir - sorguların performansını iyileştirdiğimiz, ancak aynı zamanda veri güncellemesini karmaşıklaştırdığımız için verilere kasıtlı olarak fazlalık eklediğimizde (çünkü yedeklilik sırasında dikkate alınması ve desteklenmesi gerekir). veri yükleme işlemi). Belki de performansı artırmak için ek toplu tablolar oluşturmamız veya Vertica'daki projeksiyonlar gibi ek DBMS özelliklerini kullanmamız gerekecek.
Bu nedenle, ambar verilerini modellerken aslında birkaç sorunu çözüyoruz:
Özetleyelim.
Mimari, bütünlüğünü korurken ve aynı işlevselliğin farklı yerlerde, farklı kişiler tarafından tekrarlanmasından kaçınırken, paralel çalışmalarını düzenleme imkanı sağlamalıdır. Gereksiz işçilik maliyetlerine ek olarak, bu tür tekrarlar daha sonra verilerde tutarsızlıklara yol açabilir.
Ek olarak, genellikle dağınık olan bu kadar çok insan ve ekip sistem geliştirme sürecine dahil olduğunda, kaçınılmaz olarak şu soru ortaya çıkar: aralarında iletişim ve bilgi etkileşimi nasıl kurulur. Ne kadar standart ve anlaşılır yaklaşımlar ve uygulamalar kullanılırsa, bu tür işleri kurmak o kadar kolay, kullanışlı ve verimli olur. Ve dahil olmak üzere, aralarında 1 numaralı veri ambarları için veri modelleri olan "çalışan eserler" in bileşimi hakkında düşünmeye değer (önceki bölüme bakın).
Buna inanmak için ne gibi gerekçelerim var?
İlk olarak, bir depo inşa etmek çok kaynak yoğun bir süreçtir: ekipmanın fiili maliyetlerine, gerekli teknolojik yazılım ve geliştirme lisanslarına ek olarak, şirketin neredeyse tüm sistemleri ve bölümleri de buna dahil olur. Tüm bu süreci sıfırdan tekrarlamak çok cesur bir girişimdir.
İkincisi, eğer depolama doğru mimariye sahipse, o zaman hem kaynak sistemlerin değişmesine, hem de son kullanıcılardan yeni gereksinimlerin ortaya çıkmasına ve veri hacimlerinin büyümesine kolayca dayanabilir.
Mimari doğruysa, bilgi akışları şeffafsa, böyle bir sistem, etkiyi değerlendirmedeki zorluklar nedeniyle değişiklik yaparken bir stupor durumunda kalma riski olmadan uzun süre geliştirilebilir.
Müşterilerin gözünde veri ambarı genellikle mutlak bir canavar gibi görünür - sistem geliştirmenin görevleri, hedefleri ve ufku çok hacimlidir. Ve çoğu zaman Müşteri, “bütçesi pahasına” BT departmanının bazı “kendi görevlerini” çözeceğinden korkar. Ve yine, insanlar arasındaki etkileşim sorunu ve birinin konumunu sakince ifade etme ve müzakere etme yeteneği sorunuyla karşı karşıyayız.
Yetkili mimari yaklaşımlar, sonuç vermeye başlamadan önce birkaç yıl boyunca “geliştirmeye” girmeden, işlevselliği kademeli olarak artırarak sistemi yinelemeli olarak geliştirmenize izin verir.
Unutulmamalıdır ki "mucizeler olmaz" - ve "başlangıç" da zaman alır. Depolar için oldukça büyük olabilir - çünkü bunlar büyük miktarda veridir, bu geçmiş verilerdir - bilgi işleme kurallarının mevcut olanlardan farklı olabileceği eski dönemler için. Bu nedenle, analitik geliştirme, kaynak sistemlerle etkileşim ve gerçek veriler üzerinde yük testleri de dahil olmak üzere bir dizi "deneme yanılma" için yeterli zaman gereklidir.
Depolama için en kritik ve önemli teknoloji platformu olarak DBMS'ye bakalım.
Son zamanlarda, başlangıçta "evrensel" olarak oluşturulan ilişkisel veritabanlarında uzmanlaşmaya doğru açık bir kayma olmuştur. Uzun bir süredir, önde gelen satıcılar, farklı sınıfların (OLTP, DSS & DWH) uygulamaları için çeşitli seçenekler sunuyor. Ek olarak, metin, coğrafi veriler vb. ile çalışmak için ek fırsatlar vardır.
Ancak mesele bununla sınırlı değildi - başlangıçta belirli bir görev sınıfına odaklanan ürünler ortaya çıkmaya başladı - yani. özel DBMS. İlişkisel modeli kullanabilirler veya kullanmayabilirler. Önemli olan, başlangıçta yalnızca genel olarak "iş bilgilerinin" saklanması ve işlenmesi için değil, aynı zamanda belirli görevler için "keskinleştirilmiş" olmalarıdır.
Görünüşe göre, merkezileşme ve uzmanlaşma, periyodik olarak birbirinin yerini alan, gelişmeyi ve dengeyi sağlayan birbirini tamamlayan iki eğilimdir. Evrimsel (kademeli) kademeli gelişim ve kardinal değişikliklerin yanı sıra. Böylece, 90'larda Michael Stonebreaker, dünyanın veritabanları dünyasında başka bir devrime ihtiyaç duymadığı fikrini açıkça ortaya koyan 3. Nesil Veritabanı Manifestosu'nun yazarlarından biriydi. Bununla birlikte, 10 yıl sonra, DBMS dünyasında yeni bir çağın başlangıcı için ön koşulları açıkladığı - tam olarak uzmanlıklarına dayanarak - yayınladığı eserler yayınlamaktadır.
Yaygın evrensel DBMS'lerin, donanım platformlarındaki değişiklikleri veya uygulamaların daha iyi bir çözüm bulabileceğiniz sınıflara bölünmesini dikkate almayan “herkese uyan tek bir” mimari üzerine inşa edildiği gerçeğine odaklanıyor. evrensel gereksinimlerin uygulanması.
Ve bu fikir doğrultusunda bir takım projeler geliştirmeye başlar. Bunlardan biri, orijinal olarak veri depolama sınıfı sistemleri için özel olarak oluşturulmuş, paylaşılan hiçbir şey (SN) mimarisinde tasarlanmış sütunlu bir DBMS olan C-Store'dur. Bu ürün ayrıca HP Vertica olarak ticarileştirildi.
Görünüşe göre şimdi veri ambarlarının geliştirilmesi konusu yeni bir geliştirme döngüsüne girdi. Yeni teknolojiler, yaklaşımlar ve araçlar ortaya çıkıyor. Çalışmaları, testleri ve makul uygulamaları, gerçekten ilginç ve kullanışlı çözümler yaratmamızı sağlıyor. Ve bunları uygulamaya geçirin, geliştirmelerinizin gerçek işte kullanılmasının ve fayda sağlamanın tadını çıkarın.
İşin büyük şemasında, mimarın kim olduğu önemli değil, önemli olan birinin bu soruları sorması ve cevaplarını keşfetmesidir. Mimar açıkça seçiliyorsa, bu yalnızca sistemden ve gelişiminden öncelikli olarak onun sorumlu olduğu anlamına gelir.
Bu konuyla ilgili olarak “antifrajilite” konusu bana neden alakalı göründü?
"Kırılganlığa karşı korumanın benzersizliği, bilinmeyenle çalışmamıza, tam olarak ne yaptığımızı anlamadığımız koşullarda bir şeyler yapmamıza ve başarılı olmamıza izin vermesidir."/Nassim N.Taleb/Bu nedenle, kriz ve yüksek derecede belirsizlik, mimari eksikliğin mazereti değil, ihtiyacı güçlendiren faktörlerdir.
İlgili Makaleler: | |
MCS-51 mikrodenetleyiciler: yazılım modeli, yapı, komutlar
Mikrodenetleyicinin temeli (bkz. Şekil 1) 8 bitlik bir ... Delphi Ortamını Tanımlama Delphi Programlama Ortamının Ana Bileşenleri
Hayatınızın en iyi kullanıcı arayüzlerini oluşturmaya hazır mısınız?... Mikrodenetleyiciler MCS-51: program modeli, yapısı, komutları
MCS-51 AİLESİNİN MİKRODENETLEYİCİLERİNİN MİMARİSİ Ders notları ... |