maandag 15 juni 2015

pNFS: Parallel is snel, en dat niet alleen...

Storage als ondersteuning voor andere technologieën
Een systeem is zo snel als zijn langzaamste component. Om een systeem optimaal te laten functioneren en om te profiteren van de kwaliteiten van de componenten, dient er een situatie gecreëerd te worden waarin de kracht van elke component voldoende tot zijn recht komt.
Op het gebied van bijv. datamining en cloud computing zijn er allerlei interessante ontwikkelingen. Of deze voldoende tot hun recht komen is o.a. afhankelijk van de gekoppelde storage. Een relatief nieuwe ontwikkeling op het gebied van storage die andere technologieën ondersteunt of versterkt is paralell Network File System (pNFS).

pNFS: Snel
Een belangrijke eis waar storage aan moet voldoen is snelheid. Er zijn verschillende manieren om een hogere performance te realiseren, zoals het type opslagschijven. Een andere manier is nieuwe, slimmere kanalen vinden om het lezen en schrijven van data plaats te laten vinden. Dat laatste is wat pNFS doet.
De pNFS architectuur houdt in dat de metadata server is weggehaald uit het data pad. Dit zorgt ervoor dat computers direct met de fysieke storage apparatuur kunnen communiceren, en dat deze communicatie parallel kan plaatsvinden. De Meta Data Server wordt alleen gebruikt om metadata te controleren en toegang te coördineren, waardoor enorm snelle toegang tot zeer grote data sets van vele data clients mogelijk wordt, en de performance bottleneck wordt geëlimineerd.
Bron: www.pnfs.com

pNFS: Schaalbaar
Voor datasets die steeds groter worden of voor pieken in dataverkeer is het fijn als schaalbaarheid goed mogelijk is. Voorheen ondersteunde NFS geen Content Addressed Storage, waardoor opschalen leidde tot een flink verhoogde complexiteit in file management, en er voor grote omgevingen naar andere storage architecturen gezocht moest worden. Het nadeel daarvan was dat er dan niet geprofiteerd kon worden van de eenvoud van de NFS standaard.
pNFS ondersteunt wel Content Addressed Storage. Nu kan de systeem capaciteit onbeperkt worden geschaald, met behoud van eenvoud in het management en zonder overall performance te beïnvloeden. 'The best of both worlds' dus.

Volgende week zal ik meer vertellen over PanFS, het storage operating system van Panasas, en de voordelen van de RAID 6+ technologie waar het mee werkt. Hierbij alvast een interessant filmpje van Garth Gibson (CTO en co-founder van Panasas) over cloud computing met parallel file systems en high performance storage.


Geen opmerkingen:

Een reactie posten