Amazon S3 Select poprawia wydajność zapytań nawet 9-krotnie podczas korzystania z Trino
Amazon S3 poprawia wydajność zapytań działających w Trino nawet 9-krotnie przy korzystaniu z Amazon S3 Select.
Trino to silnik zapytań SQL o otwartym kodzie źródłowym, używany do uruchamiania interaktywnych analiz danych przechowywanych w Amazon S3. Dzięki S3 Select „przesuwasz” pracę obliczeniową w celu filtrowania danych S3 zamiast zwracania całego obiektu. Korzystając z Trino z S3 Select, pobierasz tylko podzbiór danych z obiektu, zmniejszając ilość zwracanych danych i tym samym przyspieszając wydajność zapytań.
Od dzisiaj, dzięki wkładowi AWS upstream w open source Trino, możesz używać Trino z S3 Select, aby poprawić wydajność zapytań. S3 Select przenosi ciężar filtrowania i uzyskiwania dostępu do danych wewnątrz obiektów do Amazon S3, co zmniejsza ilość danych, które muszą być przesyłane i przetwarzane przez Trino. Na przykład, jeśli masz jezioro danych zbudowane na Amazon S3 i korzystasz z Trino dzisiaj, możesz użyć funkcji filtrowania S3 Select, aby szybko i łatwo uruchamiać interaktywne zapytania ad-hoc.
Aby dowiedzieć się więcej o wykorzystaniu S3 Select z Trino, odwiedź blog techniczny S3. Aby dowiedzieć się więcej o złączu S3 Select Trino, odwiedź repozytorium Trino GitHub. W celu uzyskania informacji o wycenie, odwiedź stronę cennika Amazon S3.
źródło:AWS