
Novinky z Microsoft Fabric
Každý měsíc procházíme, co nového přibylo v Power BI a Microsoft Fabric, řešíme, co nás zaujalo a snažíme se přidávat kontext, poznámky, případně praktické zkušenosti, když můžeme. Stále to ladíme a budeme rádi za jakoukoliv zpětnou vazbu. Čerpáme z oficiálního blogu Microsoftu a od komunitních legend.
ROZŠÍŘENÍ REST API PRO CAPACITY MANAGEMENT
Konečně je možné přes REST API:
- vytvářet Fabricové kapacity,
- upravovat jejich konfiguraci,
- spravovat jejich alokaci.
Tohle dává smysl zejména tam, kde se infrastruktura automatizuje a kapacity se orchestruálně nasazují podle potřeby.
LOGOVÁNÍ: O NĚCO LEPŠÍ
Vylepšení logů se týká hlavně toho, že:
- jednotlivé Spark joby jsou nově svázané s konkrétními notebooky,
- takže když hledáte chybu, víte, odkud to pochází.
Zároveň jsou nově dostupné určité segmenty logů pro lepší filtrování, ale…
“Spark cluster zvládne vygenerovat za pár minut miliardy záznamů. Filtrace je možná, ale orientace v takovém objemu není úplně snadná.”
AI SKILLS
Microsoft silně tlačí na tzv. AI Skills – připravené prostředí se zabudovanými komponentami (částečné LLM, předinstalované knihovny, atd.). Využívají Spark, takže kdo není kamarád se Sparkovým světem, může trochu narážet. Na Learn portálu už ale najdete scénáře, které se dají vyzkoušet – zatím spíš sandboxový přístup než něco, co by se rovnou dávalo do produkce.
COLLATIONS VE WAREHOUSE: DROBNOST, KTERÁ POTĚŠÍ
Doteď byly collations ve Fabric warehouse dost omezené (v podstatě binární – case-sensitive vždy). Teď je:
- možné nastavit collation při CREATE TABLE,
- nebo změnit přes ALTER TABLE,
- zatím pouze skriptem, v UI to ještě není.
“Hledali jste ‘Franta Vomáčka’ a nenašli jste ‘franta vomáčka’? Teď už jo.”
BULK INSERT + OPENROWSET
Další příjemná novinka – možnost provádět bulk insert přímo z externích zdrojů pomocí OPENROWSET.
- Hodí se pro scénáře, kdy potřebujete dostat velké objemy dat dovnitř bez pipeline.
- V kombinaci s externími tabulkami dává smysl i pro automatizovaný příjem dat.
EVENT HOUSE JIŽ NENÍ ZDARMA
Dříve bylo možné aktivovat monitoring workspace a data byla automaticky ukládána do Event Housu bez dalších nákladů. Nyní se však za tuto funkcionalitu platí – především kvůli tomu, že běží nad Event Stream technologií, která je nákladná na provoz (zejména v kombinaci s KQL dotazy a objemem dat).
Doporučujeme zkontrolovat konfigurace a očekávanou spotřebu CU před nasazením.
EXTERNAL DATA SHARING: FABRIC DOSTÁVÁ „DATA SHARE“ FUNKCI
Tahle věc je dost podobná tomu, co známe z Azure Data Share:
- vytvoříte „obal“ dat (dataset, tabulky, schémata),
- nastavíte příjemce,
- data se automaticky pravidelně posílají přes zabezpečený most.
“Microsoft nám takhle každé ráno pushuje data z MS Learn o certifikacích. V podstatě hotové API bez nutnosti si něco tvořit.”
Potenciál pro poskytování dat klientům formou Data as a Service ať už z Lakehouse, Warehouse nebo Kusto databáze. Vše lze konzumovat přes SQL Analytics endpoint.
To je od nás vše k únorovým novinkám. Pokud Vás některá z funkcí zaujala, dejte nám vědět. Budeme rádi za zpětnou vazbu.