Karmaşık işbirliklerini çözme, maliyetleri ve karmaşıklığı artırma

İşletmeler dijital altyapılarına giderek daha fazla güvenirken, kesinti süresinin orantılı olarak daha büyük bir etkisi vardır. Bununla birlikte, veri merkezindeki kesintileri azaltmaya gösterilen özen meyvesini veriyor gibi görünse de, kesinti başına maliyetler düşmüyor.

Uptime araştırma yöneticisi Andy Lawrence, yıllık kesinti oranlarındaki “küçük iyileştirmeler” eğiliminin, kalan kesintilerin yüksek maliyetine işaret ediyor olabileceğini söylüyor. 2020’de Uptime’ın küresel veri merkezi anketine yanıt verenlerin yaklaşık %78’i kesinti yaşadığını bildirdi, ancak 2022’de bu oran %60’a düştü.

Lawrence, “En pahalı kesintiler, bazen şirket değerlemelerini etkileyen iş kaybı ve itibar riskiyle felaketle sonuçlanabilir” diyor. “Ancak daha rutin ve çok daha az etkili kesintiler bile daha pahalı hale geliyor, çünkü nispeten basit hafifletme maliyetleri bile artıyor.”

Veri merkezlerini daha ucuza inşa etme yönündeki baskıya rağmen, kesintiyle ilgili gelir kaybını veya mali etkileri önlemek amacıyla daha fazlası, dağıtılmış yedeklemeler ve kurtarma hizmetlerinin yanı sıra yerinde esnekliğe yatırım yapıyor. Lawrence, kesintilerin de elbette enflasyona maruz kaldığını ve parça, işçilik, hizmet düzeyi ihlallerinin ve benzerlerinin etkilendiğini söylüyor.

Uptime tarafından ankete katılanların yaklaşık %40’ı profesyonel BT veya veri merkezi hizmet sağlayıcılarındandı. yaklaşık %57 Toplam 830 katılımcı, yıllık geliri 10 milyon doların altında olan kuruluşlardan – çoğunlukla danışmanlar, tasarım mühendisleri ve üst düzey yöneticiler – selamladı ve ankete katılanların %28’i Avrupa veya Birleşik Krallık’ta bulunuyordu. Sadece %7’si 1 milyar doları aşan kulüptendi.

2022’de son üç yılda kesinti yaşayanların yalnızca %14’ü bir kesintiyi “ciddi/ciddi” olarak sınıflandırırken, 2019 anketinde bu oran %18’di. Birçoğu, sistemlerin veya ekipmanın tamamen değil, kısmi arızalarıydı.

Lawrence, kesintilerden kaçınmanın – veya en azından hızlı, sorunsuz bir iyileşme sağlamanın – önceden yatırım (eğitim dahil) yapmak anlamına geldiğine dikkat çekiyor. Ancak güç sorunları endişe verici olmaya devam ederken, bunlar iyi anlaşılmıştır.

“Elektrik kesintileriyle ilgili maliyetlerin çoğu artık sistemlerin yeniden başlatılması ve verilerin kurtarılması ve senkronizasyonu ile ilgili” diyor.

“Model dijital altyapısının karmaşık birbirine bağlılığı, büyük, tek tesisli arızaların hafifletilmesine yardımcı olabilir, ancak daha yeni dağıtılmış mimariler kendi arızalarına tabidir. Yazılım ve yapılandırma hataları genellikle farklı siteler ve hizmetlerde yankılanıyor.”

“Elektrik kesintileriyle ilgili maliyetlerin çoğu artık sistemlerin yeniden başlatılması ve verilerin kurtarılması ve senkronizasyonu ile ilgilidir”

Andy Lawrence, Çalışma Süresi

Persistent Systems’de bulut ve altyapıdan sorumlu kıdemli başkan yardımcısı Nitha Puthran, büyük yapay zeka ve makine öğrenimi özellikli veri ambarları dahil olmak üzere dijitalleştirilmiş sistemlere ve uygulamalara artan güvenin daha yüksek maliyetler getirebileceğini söylüyor.

Daha iyi yedek güç sistemleri ve etkili felaket kurtarma yazılımı ve operasyonel planlar, ortaya çıktıkça daha fazla kesintiyle başa çıkarken, “kas hafızasını” sağlamak için kapsamlı bir şekilde test edilen prosedürlerle, felaket kurtarma stratejileri optimal olmayabilir.

Puthran, “Birçok kuruluş bunu BT stratejilerinin bir parçası haline getirmiyor; bu hâlâ sonradan akla gelen bir şey” diyor. “Günlük işleri yürütecek altyapıya çok harcamayı seviyorlar, ancak daha çok bir lüks olarak düşünebilecekleri fazlalığı inşa etmeye daha az – özellikle de bu dönüşüm aşamasında.”

Büyük sağlayıcılarla iş birliği yapan daha küçük kuruluşlar, ayrıntılı bilgileri okumalı, kullanılabilirlik düzeylerini anlamalarını ve yetersiz kalmamalarını sağlamalıdır. Puthran, özellikle kaynaklar kısıtlı olduğunda, kesintiler ve bunların telafisi için planlama ve bütçelemenin genellikle biraz yetersiz kaldığını söylüyor.

“Ve tatbikatlar artık bir onay kutusu olamaz – uyumun vb. bir parçası olarak gerçek olmalı ve zamanında yapılmalı,” diyor ve etkili planların insanları, süreçleri ve süreçleri dikkate alması gerektiğini ekliyor. teknoloji.

“Çözüm tasarlamış olsalar veya bunu işbirliği içinde yapıyor olsalar bile, iyi belgelenmiş, iyi tasarlanmış bir süreçten geçtiğinden emin olun” diyor. “Bir şey olursa nasıl daha hızlı, daha az hasarla geri döneriz?”

Cevap eğitim mi? Puthran, belki – ancak bu, bir hizmet sağlayıcıdan gelen yaklaşımın inceliğine bağlı olabilir, diye ekliyor.

Ne yersen osun

Bulut çözümleri sağlayıcısı Logicalis’in baş teknoloji uzmanı Neil Thurston, “dijital spagetti’nin zirvede olduğunu” belirtiyor – özellikle de kuruluşlar Covid gibi olaylarla başa çıkmak için dönüşürken, yalnızca kendisi bir karmaşıklık kaynağı değil, aynı zamanda sonuçta ortaya çıkan maliyetler.

Kaçınılmaz olarak, bu fenomenin bazı yönleri muhtemelen yeni bir normali temsil edecek ve devam eden beceri eksiklikleri ile birleşebilir. Thurston, “Kendi veri merkezlerini ve üçüncü tarafları işleten kendi müşteri tabanımızda ve pandemi ve küresel tedarik zinciri nedeniyle standardizasyon pencereden dışarı çıktı” diyor.

İnsanlar bazen taleple kısa sürede başa çıkmak için ellerinden gelen her türlü kiti satın aldılar. Operatörler, sanal yazılım tanımlı ağlarla kaplanmış fiziksel alt ağlara sahip olabilir ve bu da ağ oluşturma tarafında karmaşıklığı artırır. Yanlış gidecek daha fazla çalışan parça da olabilir. Thurston, ağ sorunlarının her zaman bariz olmadığını veya kolayca teşhis edilemediğini söylüyor.

“Veri merkezi mühendislerinin pek alışık olmadıkları ekipmanlarla karşı karşıya geleceği ve her şeyin farklı olacağı bir dönemdeyiz; bu da sorun giderme süresinin uzamasına neden olacak” diyor.

“Bu sanal dünyada gerçekleşirse, sahip olduğunuz sorun veri merkezinin gücünü kaybetmek kadar kolay olmamasıdır. Kim etkilenir – bu herkestir. Gücü geri almalısın, ama bu sanal bir problem ve onu bulana kadar devam etmelisin. Ağ oluşturma tarafında, işin zorlaştığı yer burasıdır çünkü herkes bir ağı farklı şekilde tasarlar.”

Stratejinin bir kısmı, ek otomasyonu destekleyen bir yeniden standardizasyona yönelik olarak uygulanabilecek sorun ve bilgi yönetimi araştırmalarını içerebilir. Thurston, “Mühendislik verimliliği” kesinti yaşam döngülerini kısaltabilirken, yapay zeka ve AIops’un kalıpları tespit edip düzeltmeye yardımcı olabileceğini söylüyor.

Web güvenlik şirketi ve Google teknoloji ortağı Cloudflare’de baş teknoloji sorumlusu John Graham-Cumming, özellikle üst düzey veri merkezlerinin güç ve soğutma açısından “inanılmaz derecede kararlı” olabileceğine dikkat çekiyor. Bunun yerine kesintiler, operatörlerin sürekli olarak değişiklik yapma arzusunun kaçınılmazlığıyla nasıl başa çıktığıyla ilgili olabilir – çünkü yazılım, örneğin harici bir şey yerine sürekli olarak gelişmektedir.

“Veri merkezi mühendislerinin pek alışık olmadıkları ekipmanlarla karşı karşıya geleceği ve her şeyin farklı olacağı, dolayısıyla daha uzun sorun giderme sürelerine yol açacağı bir dönemdeyiz”

Neil Thurston, Logicalis

“İşe yarayan, şeylerin bir kombinasyonu olmuştur” diyor. “Sisteminizin dirençli olmadığı yerleri bulmak istiyorsunuz. Bir tür kaos mühendisliği yapıyoruz, ne olacağını görmek için kasıtlı olarak bir şeyleri kırıyoruz.

“Örneğin, hizmetleri veya makineleri veya ağ ekipmanlarını çevrimdışı duruma getirin. Büyük, birbirine bağlı karmaşık sistemlerde, sorunları ortadan kaldırmak için kaos getirmek değerli olabilir.”

Yazılım gibi zincirdeki unsurları gözlemlerken aşamalı sunumlar, özellikle heterojen bir ortamda belirli bir ölçekte veya sayıda konum ve kullanıcıda ortaya çıkan etkileri yakalamaya yardımcı olabilir, diyor. Bu, geçmişi hızlı bir şekilde anlamaya ve X veya Y’yi etkileyen değişiklikleri olduğu gibi izlemeye yardımcı olabilir.

Graham-Cumming’e göre olağan şüpheliler artıklık, dayanıklılık, felaket kurtarma, yük dengeleme ve daha fazlasını içerir, ancak kültür, kesinti başına etkilerde büyük bir rol oynayabilir.

Sebep veya sebepler için sorumluluğu hedefleyen enerjiyi boşa harcamayan “suçsuz” bir yaklaşım benimsenmesini tavsiye ediyor. Bunun yerine, kaçınılmaz bilinmeyenler de dahil olmak üzere sorunu, suçu paylaşmadan olabildiğince çabuk çözmek için herkesin bir araya gelmesine odaklanın.

“Herkes, ‘Hey, bir sorun veya potansiyel bir sorun gözlemliyorum’ diyebilmeli ve doğru kişilerin oraya gitmesini ve bunu yapmasını sağlamak için hemen şimdi bir olay çağırabilmeli ve bu tamamen suçsuz olmalı. Graham-Cumming, “özellikle ‘sorumlu’ kişi yalnızca işini yapan ve bir şeyler başarmaya çalışan bireysel bir katılımcıysa.”

Hyve Managed Hosting’in direktörü Jake Madders, tedarikçileri çeşitlendirmenin bazen tek bir oyuncuya tamamen güvenmekten kaçınarak yardımcı olabileceğini öne sürüyor. Sonuçta, herkesin öngörülemeyen sorunları olabilir.

“Bunun arttığına dair bir eğilim gördük – Covid ile ilgili olduğunu düşünüyoruz, çünkü herkes mesafeli” diyor ve bunun tedarikçi iletişimini bazen daha zor hale getirebileceğini ekliyor. Ayrıca, “masalar arası” konuşmalara ve olaylara maruz kalma eksikliği, bir kuruluşun beklenmedik olayları takip etme becerisini azaltabilir.

Madders, “Bir müşterimiz varsa, malzemelerinin yarısını birinciye koyarız ve ardından felaket kurtarmaları için ayrı bir tedarik kullanırız ve aynı şey İSS’lerimiz veya ağ sağlayıcılarımız için de geçerlidir” diyor.

İnovasyon karmaşıklığı hem çözer hem de artırır

Madders, bir müşteriyle, kendi sistemleri ile Hyve’ın rafları arasına girmek için kendi pil sistemlerini kurduklarını söylüyor; bu, bir zamanlar üçüncü veya dördüncü katman veri merkezleri için duyulmamış bir hareket.

Artan maliyetler, siber güvenlik tehditleri ve uyumluluk talepleri ve tesis içi yakıt, jeneratörler ve kit dahil olmak üzere esnekliğe odaklanan çok sayıda politika ve prosedüre rağmen, elektrik kesintileri ve donanım arızaları hala meydana geliyor – öyleyse iletişim neden daha zor olsun?

Madders, “Bazıları için 10 dakikalık bir kesinti işleri için felaket olabilir” diyor. “Pek çok şey tahmin edilebilir ama pek çoğu tahmin edilemez. Bir strateji oluşturabilirsiniz, ancak yine maliyeti engelleyici olabilir ve her şeyin zayıf noktaları vardır.

IDC analisti Phil Goodwin, firmasının ilk çeyrek raporunda Fidye yazılımının durumu ve felakete hazırlık 2022 (Mayıs ayında piyasaya sürülen ve güvenlik satıcısı Zerto tarafından desteklenen), veri bütünlüğü ve kullanılabilirliğine yönelik risklerin aslında hiç bu kadar yüksek olmayabileceğini öne sürüyor. Kötü amaçlı yazılım, hırsızlıktan kaynaklanan veri kaybı ve fidye yazılımı artık yaygın hale geldi ve etkili bir felaket kurtarma ihtiyacını vurguluyor.

Yanıt verenlerin neredeyse %80’i, son 12 ay içinde bir olağanüstü durum müdahalesini etkinleştirdi; bu yanıtların %61’i kötü amaçlı yazılım tarafından tetiklendi ve %94’ü, yazılım arızası, donanım arızası ve fidye yazılımı gibi başlıca nedenler olmak üzere planlanmamış kesinti süresi bildirdi. Ayrı bir IDC araştırmasının maliyeti, tüm sektörlerde ve kuruluş boyutlarında ortalama kesinti süresinden saatte 250.000 ABD dolarıdır.

Goodwin şöyle diyor: “Çekirdekteki, buluttaki ve uçtaki yeni uygulamalar, yapılandırılmış, yapılandırılmamış ve kapsayıcıya alınmış veriler oluşturuyor. Bu veriler, AWS S3 ve Azure Blob gibi coğrafi olarak dağınık nesne depolama hizmetlerinde bulunur.”

Çözümler arasında, bu karmaşıklığı yanıtlamak için hizmet düzeyi anlaşmalarının (SLA’lar) kurtarma süresi veya veri kaybı etrafında yeniden boyutlandırılması yer alabilir, diye ekliyor.

Çözüm sağlayıcısı Aggreko’nun küresel veri merkezleri sektör başkanı Billy Durie, daha fazla veri merkezinin elektrik kesintilerini genellikle inşa etme, yükseltme veya yenileme durumunda geçici olarak yerinde ek megavat üreterek çözmeye çalıştığını doğruluyor.

Durie, “Yine de ekipmanı ve hatta parçaları değiştirmenin maliyeti artıyor” diyor. “Bakır fiyatları yükseliyor ve enflasyon her zaman işçilik, çağrılar ve diğer şeylerle maliyetleri artıracak. Doğru insanlara ulaşmak bile zorlaşıyor.”

Durie, kesintilerin azaldığı yerlerde bunun nedeninin, operatörlerin kendi ihtiyaçlarına özel olarak tasarım yapmaya yönelik önceki, daha “kurabiye” yaklaşımından uzaklaşmaları olabileceğini söylüyor. Bununla birlikte, özellikle iklim baskıları söz konusu olduğunda, geleceğe hazırlık ve acil durum planlamasına daha fazla ihtiyaç duyulabilir.

Read Previous

Yapılandırılmamış verilerden yapı nasıl elde edilir

Read Next

İyi niyetli bilgisayar korsanlarını korumak için yeni altın standart

Leave a Reply

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

organik hit - iş fikirleri -