Маю мінімальний експірієнс у цій сфері, коли працював на Nordstrom - великий реселлер що має власний freight-pay solution. Це типу доставка бізнес замовлень від виробників (з Китаю) і звітність на усіх етапах. У них купа складів і варіатів доставки літаком морем або траками. На різних етапах генерується купа різних документів котрі у різних місцях зберігаються або навіть і не збірігаються. Досить часто це не структуровані дані, тобто просто текстові/табличні дані у довільних або майже довільних форматах. Я розробляв трекінг елемент системи для нового делівері контрактора що має свій новий формат звітності плюс генерує івенти локації під час делівері і після збору тестових файлів треба було зробити деяку аналітику. У моєму випадку це були просто текстові файли у яких зрозуміло загальний пошук «по усім» не можливий. Але є сервіси типу Amazon Athena котрі типу індексують оці всі не структуровані файли і дають можливість ранити SQL запити по індексованих даних як наче то не файли а база даних. Далі треба було зібрати за допомогою тих запитів деяку статистику про те наскільки якісно генеруються трекінг івенти і чи дозволяють вони реалізувати business need - close to real time shipments tracking