Wat is zelf in Python: voorbeelden uit de echte wereld
Wat is zelf in Python: voorbeelden uit de echte wereld
In deze zelfstudie bespreken we de verschillende statistische functies in SQL en hoe we ze kunnen gebruiken. In SQL worden statistische functies gebruikt om gegevens uit meerdere rijen te verzamelen in één samenvattingsrij.
Geaggregeerde functies in SQL kunnen zeer nuttig zijn voor analisten bij het samenvatten van gegevens.
Inhoudsopgave
Veelgebruikte geaggregeerde functies in SQL
Hieronder worden enkele veelgebruikte statistische functies in SQL weergegeven .
Houd er rekening mee dat de en functies vaak worden gebruikt in valuta's of gehele getallen. De AVG-functie retourneert niet alleen het gemiddelde maar ook het gemiddelde van een kolom. Ook is de aggregatiefunctie de enige die nulwaarden niet negeert bij het uitvoeren van berekeningen.
Laten we enkele voorbeeldopdrachten maken met behulp van onze vijf statistische functies met de onderstaande voorbeeldtabel.
Laten we eerst een commando maken met de MAX-functie . Laten we zeggen dat we het product met de hoogste waarde willen vinden onder de kolom Productnaam. Onze opdracht zou er ongeveer zo uit moeten zien als de onderstaande afbeelding.
Aangezien we het product met de hoogste waarde vinden, moeten we hun prijzen krijgen, die zich onder de kolom ProductPrice bevinden . Plaats altijd een alias om de uitvoerkolom een naam te geven. Als we die opdracht uitvoeren, toont het ons het product met de hoogste waarde met slechts één waarde.
Laten we vervolgens een opdracht maken met de MIN-functie . Aangezien de MIN-functie enigszins lijkt op de MAX- functie , gebruiken we hetzelfde voorbeeld dat we gebruikten in de MAX-functie , maar deze keer vinden we het product met de laagste waarde.
Wanneer we deze opdracht uitvoeren, wordt het product met de laagste waarde in onze voorbeeldtabel opgehaald.
Laten we nu een opdracht maken met de functie AANTAL . Laten we zeggen dat we het aantal producten willen vinden onder de kolom ProductID . Onze opdracht zou er ongeveer zo uit moeten zien als de onderstaande afbeelding.
Als we deze opdracht uitvoeren, toont het ons de hoeveelheid van elk product onder de ProductID- kolom en hun respectieve prijs.
Geaggregeerde functies en GROUP BY-clausule
Laten we nu bespreken hoe we meerdere kolommen met statistische functies kunnen gebruiken . Om dit te doen, moeten we de GROUP BY-clausule gebruiken .
De functie GROUP BY wordt meestal gebruikt in statistische functies omdat deze één record uit elke groep retourneert. Ook moeten alle kolommen in de SELECT-instructie, zelfs zonder aggregatie, nog steeds worden opgenomen.
Laten we bespreken hoe we geaggregeerde functies zullen gebruiken met de GROUP BY-component met onze voorbeeldtabel hieronder.
Laten we eerst proberen een opdracht uit te voeren zonder de GROUP BY-clausule te gebruiken om het verschil te zien. Laten we het totale SaleAmount zoeken in de kolom ProductName . Onze opdracht zou er ongeveer zo uit moeten zien als de onderstaande afbeelding.
Zoals je hebt gemerkt, is de opdracht vergelijkbaar met de vorige voorbeelden die we aan het begin van deze zelfstudie noemden. Nadat we deze opdracht hebben uitgevoerd, wordt eenvoudig het totale bedrag berekend onder de kolom SaleAmount , wat 28 zal zijn .
Laten we nu nog een voorbeeld nemen met de GROUP BY-clausule .
Omdat we de GROUP BY-clausule gebruiken , kunnen we nu meerdere kolommen gebruiken. Deze keer willen we het totale SaleAmount per categorie zien .
De GROUP BY-clausule zorgt ervoor dat het resultaat een som van de verkopen voor elke categorie weergeeft en als het wordt uitgevoerd, is het resultaat de onderstaande afbeelding.
In dit voorbeeld is het belangrijk om de GROUP BY-component te gebruiken, omdat anders een fout optreedt. Dit komt doordat de categorie niet is opgenomen in een GROUP BY-component of statistische functie.
Laten we hetzelfde voorbeeld nemen, maar deze keer krijgen we ook het totale SaleAmount per productnaam . Onze opdracht zou er ongeveer zo uit moeten zien als de onderstaande afbeelding.
Zodra we onze opdracht hebben uitgevoerd, toont het resultaat de som van de verkopen per categorie en per productnaam .
Onthoud dat u geen meerdere kolommen kunt gebruiken of openen zonder de GROUP BY-clausule te gebruiken, want als u dat deed, veroorzaakt dit een fout zodra u uw opdracht uitvoert.
Geaggregeerde functies in SQL Server Management Studio (SSMS)
Laten we nu bespreken hoe we statistische functies kunnen gebruiken in SQL Server Management Studio . We gebruiken de onderstaande tabel in onze voorbeelden.
We hebben 31.465 rijen met gegevens in onze SalesOrderHeader- tabel. Voor ons eerste voorbeeld laten we zien hoe we de functie COUNT kunnen gebruiken door de rijen in onze tabel te tellen. Onze opdracht zou eruit moeten zien als de onderstaande afbeelding.
We hebben met succes alle rijen in onze SalesOrderHeader geteld en hebben deze countofrows genoemd . Zodra we deze opdracht uitvoeren, hebben we een resultaat van 31.465 rijen .
Laten we teruggaan naar onze dataset. Laten we, terwijl we dezelfde aggregatiefunctie gebruiken , tellen hoeveel SalesPersonID er in onze tabel zit. Onze opdracht zou moeten zijn:
Wanneer we onze opdracht uitvoeren, haalt het specifiek gegevens op onder de kolom SalesPersonsID en geeft het ons een kolom met de naam countofsalespersons met als resultaat 3806 .
Geaggregeerde functies gebruiken in één enkele query
Laten we verder gaan en bespreken hoe we meerdere statistische functies in één query kunnen gebruiken. We zullen de functies SUM , AVG en MAX gebruiken bij het samenvoegen van onze kolommen TotalDue en TaxAmt .
We kunnen meerdere geaggregeerde functies in één zoekopdracht gebruiken door een komma achter elke functie te plaatsen.
Nadat we deze opdracht hebben uitgevoerd, zou ons resultaat eruit moeten zien als de onderstaande afbeelding.
Nu kunnen we de verschillende kolommen samen met hun respectieve waarde zien met behulp van meerdere statistische functies .
Laten we proberen een commando uit te voeren waarbij het een fout veroorzaakt om te benadrukken waarom we de GROUP BY-clausule moeten gebruiken bij het selecteren van kolommen. We gebruiken hetzelfde voorbeeld met meerdere functies, maar deze keer selecteren we CustomerID .
Zoals u kunt zien, zegt het dat de opdracht ongeldig is omdat CustomerID niet is opgenomen in de statistische functie of de GROUP BY-clausule .
Voorbeeldscenario met GROUP BY-clausule
Laten we voor ons volgende voorbeeld onze fout oplossen door de GROUP BY-clausule in onze opdracht op te nemen.
We hebben zojuist CustomerID toegevoegd aan een GROUP BY-clausule en nu kunnen we de som, het gemiddelde en de maximale waarde zien van onze TotalDue en TaxAmt by CustomerID. We kunnen ook zien dat we in totaal 19119 rijen hebben .
Laten we ons laatste voorbeeld nemen door te bespreken waarom het belangrijk voor ons is om ervoor te zorgen dat niet-geaggregeerde kolommen en expressies worden opgenomen in de GROUP BY-component .
In onze tabel SalesOrderHeader hebben we de kolom OrderDate . Laten we zeggen dat we de som van TotalDue per jaar willen hebben . Als we niet alle niet-geaggregeerde kolommen en uitdrukkingen aangeven, moeten we de opdracht uit de onderstaande afbeelding gebruiken.
Merk op hoe we een resultaat kunnen krijgen in plaats van een fout. We hebben echter meerdere rapporten voor hetzelfde jaar, terwijl het ons doel is om de rapporten samen te vatten in één specifieke waarde per jaar.
Om onze fout te corrigeren, moeten we ervoor zorgen dat we de uitdrukking ook opnemen in onze GROUP BY-clausule . Ons nieuwe commando zou moeten zijn:
Na het uitvoeren van de opdracht kunnen we zien dat we met succes de som van OrderDate per jaar hebben verkregen.
HAVING-clausule in SQL Geaggregeerde functies
Opgeslagen procedures in SQL | Een overzicht van
effectieve manieren om de GROUPBY-functie in LuckyTemplates te gebruiken
Conclusie
Om samen te vatten, u hebt een deel van de basiskennis geleerd over het gebruik van statistische functies in SQL. Geaggregeerde functies kunnen heel ideaal zijn bij het werken met grote rapporten of datasets, omdat ze analisten gemak bieden tijdens data-analyse en samenvatting.
Hopelijk kan deze tutorial je helpen om beter te oefenen met het gebruik van verschillende statistische functies in SQL. Als u meer wilt weten over dit onderwerp en andere gerelateerde inhoud, kunt u zeker de lijst met relevante links hieronder bekijken.
Al het beste,
Hafiz
Wat is zelf in Python: voorbeelden uit de echte wereld
Je leert hoe je objecten uit een .rds-bestand in R opslaat en laadt. In deze blog wordt ook besproken hoe je objecten uit R naar LuckyTemplates importeert.
In deze tutorial over DAX-coderingstaal leert u hoe u de functie GENERATE gebruikt en hoe u de titel van een maat dynamisch wijzigt.
Deze zelfstudie behandelt hoe u de Multi Threaded Dynamic Visuals-techniek kunt gebruiken om inzichten te creëren op basis van dynamische gegevensvisualisaties in uw rapporten.
In dit artikel zal ik de filtercontext doornemen. Filtercontext is een van de belangrijkste onderwerpen waarover elke LuckyTemplates-gebruiker in eerste instantie zou moeten leren.
Ik wil laten zien hoe de online service LuckyTemplates Apps kan helpen bij het beheren van verschillende rapporten en inzichten die uit verschillende bronnen zijn gegenereerd.
Leer hoe u wijzigingen in uw winstmarge kunt berekenen met behulp van technieken zoals vertakking van metingen en het combineren van DAX-formules in LuckyTemplates.
Deze tutorial bespreekt de ideeën van materialisatie van datacaches en hoe deze de prestaties van DAX beïnvloeden bij het leveren van resultaten.
Als u tot nu toe nog steeds Excel gebruikt, is dit het beste moment om LuckyTemplates te gaan gebruiken voor uw zakelijke rapportagebehoeften.
Wat is LuckyTemplates Gateway? Alles wat u moet weten