当我们需要汇总表中的数据而不是使用表中某一行数据时,可以使用Mysql为我们提供的聚合函数,在mysql中,常用的聚合函数有以下五个:
- AVG:取平均值
- count:取统计值
- MAX:取最大值
- MIN:取最小值
- SUM:取和值
1.获得表中人口的总和
mariadb [world]> select SUM(Population) FROM city; +-----------------+ | SUM(Population) | +-----------------+ | 1429559884 | +-----------------+ 1 row in set (0.01 sec)
2.获得数据表中中国的总人口
MariaDB [world]> SELECT SUM(Population) FROM city WHERE CountryCOde='CHN'; +-----------------+ | SUM(Population) | +-----------------+ | 175953614 | +-----------------+ 1 row in set (0.00 sec)
3.查询中国有多少个城市
MariaDB [world]> SELECT COUNT(ID) FROM city WHERE CountryCode = 'CHN'; +-----------+ | COUNT(id) | +-----------+ | 363 | +-----------+ 1 row in set (0.00 sec)
关于COUNT,如果要统计有该表有多少行,千万别用*作为参数,因为~影响性能,选某一列就好了。
4.查询中国人口最少的城市的人口是多少
MariaDB [world]> SELECT MIN(Population) FROM city WHERE CountryCode = 'CHN'; +-----------------+ | MIN(Population) | +-----------------+ | 89288 | +-----------------+ 1 row in set (0.00 sec)
5.查询中国人口最多的城市的人口
MariaDB [world]> SELECT MAX(Population) FROM city WHERE CountryCode = 'CHN'; +-----------------+ | MAX(Population) | +-----------------+ | 9696300 | +-----------------+ 1 row in set (0.00 sec)
6.查询河南各城市的平均人口
MariaDB [world]> SELECT AVG(Population) FROM city WHERE District ='Henan'; +-----------------+ | AVG(Population) | +-----------------+ | 383278.3333 | +-----------------+ 1 row in set (0.00 sec)
所以,我们看到,聚合函数通常用于数值上的计算。
分组查询
以上,我们使用聚合函数时,是对所有SELECT的数据进行分组操作,假如我们想要查询所有国家的城市数,不得不多次使用WHERE对CountryCode进行筛选。
MariaDB [world]> SELECT DISTINCT CountryCode FROM city; +-------------+ | CountryCode | +-------------+ | ABW | | AFG | ............... | ZWE | +-------------+ 232 rows in set (0.00 sec)
我们看到,在我们的数据表中,有232个国家,那么?是不是需要我们对这232个不同国家都使用一次COUNT(ID)才能统计每个国家的城市数量呢?其实不然。
我们可以使用分组查询GROUP BY,什么叫分组呢? 分组查询就是使用指定的一列或多列,对数据进行逻辑分组(当分组依据相同时被划分为一组),假设有如下数据:
MariaDB [world]> SELECT * FROM city LIMIT 5; +----+----------------+-------------+---------------+------------+ | ID | Name | CountryCode | District | Population | +----+----------------+-------------+---------------+------------+ | 1 | Kabul | AFG | Kabol | 1780000 | | 2 | Qandahar | AFG | Qandahar | 237500 | | 3 | Herat | AFG | Herat | 186800 | | 4 | Mazar-e-Sharif | AFG | Balkh | 127800 | | 5 | Amsterdam | NLD | Noord-Holland | 731200 | +----+----------------+-------------+---------------+------------+ 5 rows in set (0.00 sec)
我们使用GROUP BY CountryCode就是指定CountryCode作为分组依据,所以1,2,3,4行他们被分为同一组,而5在另一个组。
- 通常分组是配合聚合函数来使用的,聚合函数对每个单独的逻辑分组进行汇总计算。
- GROUP BY子句中列出的每一列都必须是检索列或有效的表达式(但不能是聚合函数),如果在SELECT中使用表达式,则必须在GROUP BY子句中指定相同的表达式,且不能使用别名。
- 除聚合函数外,SELECT语句中的每一列都必须在GROUP BY子句中给出。
- 如果分组中包含具有NULL值的行,则NULL将作为一个分组返回。
- GROUP BY子句必须出现在WHERE子句之后,ORDER BY子句之前。
1.查询各个国家的城市数量
MariaDB [world]> SELECT CountryCode,COUNT(ID) FROM city GROUP BY CountryCode; +-------------+-----------+ | CountryCode | COUNT(ID) | +-------------+-----------+ | ABW | 1 | | AFG | 4 | ........................... | ZMB | 7 | | ZWE | 6 | +-------------+-----------+ 232 rows in set (0.00 sec)
当SELECT语句中使用WHERE子句时,WHERE子句总在分组前进行过滤。
2.查询各个国家人口大于1000000的城市数量
MariaDB [world]> SELECT CountryCode,COUNT(ID) FROM city WHERE Population >= 1000000 GROUPP BY CountryCode; +-------------+-----------+ | CountryCode | COUNT(ID) | +-------------+-----------+ | AFG | 1 | | AGO | 1 | | ARG | 3 | | ARM | 1 | | AUS | 4 | ........................... | YUG | 1 | | ZAF | 1 | | ZMB | 1 | | ZWE | 1 | +-------------+-----------+ 77 rows in set (0.01 sec)
所以在分组中未出现的国家,没有1000000人口的城市。
3.查询总人口大于1000000的国家有哪些
HAVING子句用于过滤分组后所得到汇总值的数据,而HAVING支持的操作和WHERE子句是相同的。
例如:
MariaDB [world]> SELECT CountryCode,SUM(Population) AS Total_Population FROM city GROUP BY CountryCode HAVING Total_Population > 1000000; +-------------+------------------+ | CountryCode | Total_Population | +-------------+------------------+ | AFG | 2332100 | | AGO | 2561600 | | ARE | 1728336 | .................................. | ZAF | 15196370 | | ZMB | 2473500 | | ZWE | 2730420 | +-------------+------------------+ 108 rows in set (0.00 sec)