Hello! 欢迎来到小浪云!


Mariadb学习总结(八):聚合函数及分组查询


avatar
小浪云 2024-12-30 20

Mariadb学习总结(八):聚合函数及分组查询

当我们需要汇总表中的数据而不是使用表中某一行数据时,可以使用Mysql为我们提供的聚合函数,在mysql中,常用的聚合函数有以下五个:

  1. AVG:取平均值
  2. count:取统计值
  3. MAX:取最大值
  4. MIN:取最小值
  5. SUM:取和值
1.获得表中人口的总和
 mariadb [world]> select SUM(Population) FROM city; +-----------------+ | SUM(Population) | +-----------------+ |      1429559884 | +-----------------+ 1 row in set (0.01 sec) 
2.获得数据表中中国的总人口
 MariaDB [world]> SELECT SUM(Population) FROM city WHERE CountryCOde='CHN'; +-----------------+ | SUM(Population) | +-----------------+ |       175953614 | +-----------------+ 1 row in set (0.00 sec) 
3.查询中国有多少个城市
 MariaDB [world]> SELECT COUNT(ID) FROM city WHERE CountryCode =  'CHN'; +-----------+ | COUNT(id) | +-----------+ |       363 | +-----------+ 1 row in set (0.00 sec) 

关于COUNT,如果要统计有该表有多少行,千万别用*作为参数,因为~影响性能,选某一列就好了。

4.查询中国人口最少的城市的人口是多少
 MariaDB [world]> SELECT MIN(Population) FROM city WHERE CountryCode = 'CHN'; +-----------------+ | MIN(Population) | +-----------------+ |           89288 | +-----------------+ 1 row in set (0.00 sec) 
5.查询中国人口最多的城市的人口
 MariaDB [world]> SELECT MAX(Population) FROM city WHERE CountryCode = 'CHN'; +-----------------+ | MAX(Population) | +-----------------+ |         9696300 | +-----------------+ 1 row in set (0.00 sec) 
6.查询河南各城市的平均人口
 MariaDB [world]> SELECT AVG(Population) FROM city WHERE District ='Henan'; +-----------------+ | AVG(Population) | +-----------------+ |     383278.3333 | +-----------------+ 1 row in set (0.00 sec) 

所以,我们看到,聚合函数通常用于数值上的计算。

分组查询

以上,我们使用聚合函数时,是对所有SELECT的数据进行分组操作,假如我们想要查询所有国家的城市数,不得不多次使用WHERE对CountryCode进行筛选。

 MariaDB [world]> SELECT DISTINCT CountryCode FROM city; +-------------+ | CountryCode | +-------------+ | ABW         | | AFG         | ............... | ZWE         | +-------------+ 232 rows in set (0.00 sec) 

我们看到,在我们的数据表中,有232个国家,那么?是不是需要我们对这232个不同国家都使用一次COUNT(ID)才能统计每个国家的城市数量呢?其实不然。

我们可以使用分组查询GROUP BY,什么叫分组呢? 分组查询就是使用指定的一列或多列,对数据进行逻辑分组(当分组依据相同时被划分为一组),假设有如下数据:

 MariaDB [world]> SELECT * FROM city LIMIT 5; +----+----------------+-------------+---------------+------------+ | ID | Name           | CountryCode | District      | Population | +----+----------------+-------------+---------------+------------+ |  1 | Kabul          | AFG         | Kabol         |    1780000 | |  2 | Qandahar       | AFG         | Qandahar      |     237500 | |  3 | Herat          | AFG         | Herat         |     186800 | |  4 | Mazar-e-Sharif | AFG         | Balkh         |     127800 | |  5 | Amsterdam      | NLD         | Noord-Holland |     731200 | +----+----------------+-------------+---------------+------------+ 5 rows in set (0.00 sec) 

我们使用GROUP BY CountryCode就是指定CountryCode作为分组依据,所以1,2,3,4行他们被分为同一组,而5在另一个组。

  1. 通常分组是配合聚合函数来使用的,聚合函数对每个单独的逻辑分组进行汇总计算。
  2. GROUP BY子句中列出的每一列都必须是检索列或有效的表达式(但不能是聚合函数),如果在SELECT中使用表达式,则必须在GROUP BY子句中指定相同的表达式,且不能使用别名。
  3. 除聚合函数外,SELECT语句中的每一列都必须在GROUP BY子句中给出。
  4. 如果分组中包含具有NULL值的行,则NULL将作为一个分组返回。
  5. GROUP BY子句必须出现在WHERE子句之后,ORDER BY子句之前。
1.查询各个国家的城市数量
 MariaDB [world]> SELECT CountryCode,COUNT(ID) FROM city GROUP BY CountryCode; +-------------+-----------+ | CountryCode | COUNT(ID) | +-------------+-----------+ | ABW         |         1 | | AFG         |         4 | ........................... | ZMB         |         7 | | ZWE         |         6 | +-------------+-----------+ 232 rows in set (0.00 sec) 

当SELECT语句中使用WHERE子句时,WHERE子句总在分组前进行过滤。

2.查询各个国家人口大于1000000的城市数量
 MariaDB [world]> SELECT CountryCode,COUNT(ID) FROM city WHERE Population >= 1000000 GROUPP BY CountryCode; +-------------+-----------+ | CountryCode | COUNT(ID) | +-------------+-----------+ | AFG         |         1 | | AGO         |         1 | | ARG         |         3 | | ARM         |         1 | | AUS         |         4 | ........................... | YUG         |         1 | | ZAF         |         1 | | ZMB         |         1 | | ZWE         |         1 | +-------------+-----------+ 77 rows in set (0.01 sec) 

所以在分组中未出现的国家,没有1000000人口的城市。

3.查询总人口大于1000000的国家有哪些

HAVING子句用于过滤分组后所得到汇总值的数据,而HAVING支持的操作和WHERE子句是相同的。

例如:

 MariaDB [world]> SELECT CountryCode,SUM(Population) AS Total_Population FROM city GROUP BY CountryCode HAVING Total_Population > 1000000; +-------------+------------------+ | CountryCode | Total_Population | +-------------+------------------+ | AFG         |          2332100 | | AGO         |          2561600 | | ARE         |          1728336 | .................................. | ZAF         |         15196370 | | ZMB         |          2473500 | | ZWE         |          2730420 | +-------------+------------------+ 108 rows in set (0.00 sec) 

相关阅读