如何高效系统学习 MySQL?

  但是,你能从头至尾配置一套生产环境的数据库环境吗?你可以设计出具有优秀扩展性的表模型吗?怎么样才可以实现大数据量的快速查询?

  我认为,任何一个领域都有相应的专家,也都有一知半解的人,对于MySQL,虽然很多人觉得非常简单,但是要真正成为这个领域的专家同样有很高的难度。

  有点扯远了,本文的目标不是面向高阶数据库专家的,本文旨在引导初学者入门、帮助对MySQL感兴趣的同学了解数据库全局链路。

  现如今云服务使用越来越官方,很多同学在公司直接接触的都是rds(Relational Database Service),开箱即用,作为使用者不需要关注底层使用的到底是Oracle、Postgresql还是SQL Server,也不用关注运维和数据库安全。

  但是,我认为亲自动手配置一套SQL环境会更加容易帮助我们对数据库的理解。

  下载完之后,双击并安装该文件。需要设置一个密码,一定要记住这个密码,因为以后需要它来连接到MySQL实例。

  创建一个名为的文件,并将以下内容放入其中,这需要给本地文件读取SQL数据库的权限。

  打开系统偏好-MySQL,转到配置,选择my.cnf文件,然后点击Apply按钮。

  通过点击 在MySQL设置页面,可以 通过点击Start或者Stop来启动或者停止数据库。

  如果数据库服务正常运行,接下来就可以下载并安装MySQL工作台,工作台可以用来编辑和查询数据,并以结构化的方式返回结果。

  现在打开MySQL工作台,通过它连接到SQL服务,你会看到类似下面的东西:

  现在,你只需要点击该连接,并使用我们之前为MySQL服务器设置的密码开始工作。

  连接之后,你就会看到是一个编辑界面,在这里你可以输入一些查询语句执行数据的查询。

  手动建表太麻烦了,MySQL官网提供了一些数据样例用于学习,我们可以访问官网,下载Sakila电影数据库,然后解压。

  你可以尝试使用Sakila样本数据库文档来详细了解Sakila数据库的模型,这是设计数据库表时非常重要的环节。

  SELECT:要查询哪些列?这里我们查询col1,对col2进行SUM聚合,对col3进行AVG聚合。这里还通过使用as关键字给SUM(col2)起了一个别名

  GROUP BY:所有不在聚合中的列都需要在GROUP BY,含义就是以哪些字段分组聚合

  例如,你可以试着找出所有在2006年发行的电影、或者尝试找出所有评级为PG且长度大于50分钟的电影。

  你可以通过在MySQL Workbench上运行以下程序来完成这个任务:

  下面这张图讲列出了SQL中大多数会用到的连接,使用较多的就是LEFT JOIN和INNER JOIN:

  当你想保留左表(A)中的所有记录并关联B中的匹配记录时,就可以使用LEFT JOIN。在结果表中,B没有被关联到的A表记录被置为NULL。

  在上面这段代码中,从表A中选择col1和col2,从表B中选择col3和col4,我们还使用ON语句指定关联字段。

  当你想连接A和B并只保留A和B中的交集时,就可以使用INNER JOIN。

  回到Sakila数据库,假设我们想知道数据库中每部电影有多少分拷贝,你可以通过以下方式获得:

  你会发现你从这里面并不能得到太多有价值的信息,因为ID是一种系统设计过程中方便系统识别的标识符,但是对于用户端并不能很好理解,比如,《霸王别姬》对应的ID是1001,直接返回给你1001,看不到名称我们就很难读懂它里面的信息。

  但是,在系统模型设计过程中,一个系统流程会被拆分到多个数据表中,film_id和film的映射关系我们就需要去另外一张表中取到。

  在上面SQL中,通过film_id字段将A表与B表关联到一起,并从表B中取出了电影名称title,这样再输出结果就可以带出电影名称,方便理解了。

  但是这步骤太多、太繁琐了,而且我们必须创建一个临时表,最终会占用系统的空间。

  我们可以层层嵌套,把第一个查询结果放在一个括号里,并给这个结果起一个别名temp,然后再在temp的基础上做group by操作。

  我们可以通过使用内部查询的概念和WHERE子句来实现这个目的,如下所示,这里我们把一个内部查询嵌套在另一个内部查询中:

  HAVING子句是用来过滤最终的聚合结果的,它与WHERE不同,WHERE是用来过滤FROM语句中使用的表。HAVING过滤的是GROUP BY处理后的最终结果。

  正如你在上面的例子中看到的那样,解决一个问题,可以有很多实现方法。我们需要想出最省事的方法,因此HAVING在很多情况下更加简洁省事。

  到此为止,已经从数据库服务、到SQL工作台再到基本的数据查询做了全面的了解,想必很多同学对MySQL也有了全局的认识。

  接下来要做的就是逐个方面不断练习,我们可以自己寻找一些感兴趣的问题,然后通过SQL的方式找到答案,例如,哪个演员出演了最多的电影?哪个类型的电影被租用的最多?

  这篇内容是一个简单的教程,如果想更加深入学习SQL,给大家推荐一门来自加州大学戴维斯分校的SQL数据分析课程:SQL for Data Science Coursera,目前已经有几十万人报名,评分也非常高,感兴趣的同学可以看一下。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注