把CSV文件导入到SQL Server表中的方法

    有时候我们可能会把CSV中的数据导入到某个数据库的表中,比如做报表分析的时候。
    对于这个问题,我想一点也难不倒程序人员吧!但是要是SQL Server能够完成这个任务,岂不是更好!
    对,SQL Server确实有这个功能。

    首先先让我们看一下CSV文件,该文件保存在我的D:盘下,名为csv.txt,内容是:

    //img.jbzj.com/file_images/article/201605/https://www.lingkb.com/wp-content/uploads/2020/08/20200820020904-5f3ddb40c83e3.png

    现在就是SQL Server的关键部分了;

    我们使用的是SQL Server的BULK INSERT命令,关于该命令的详细解释,请点击此处;
    我们先在SQL Server中建立用于保存该信息的一张数据表,

    
    CREATE TABLE CSVTable(
     Name NVARCHAR(MAX),
     Email NVARCHAR(MAX),
     Area NVARCHAR(MAX)
    )

    然后执行下面的语句:

    
    BULK INSERT CSVTable
    FROM 'D:\csv.txt'
    WITH(
     FIELDTERMINATOR = ',',
     ROWTERMINATOR = '\n'
    )
    SELECT * FROM CSVTable

    按F5,执行结果如下:

    //img.jbzj.com/file_images/article/201605/https://www.lingkb.com/wp-content/uploads/2020/08/20200820020905-5f3ddb4171e4a.png

    怎么样?是不是比用程序简单!

    但是现在有几个问题需要考虑一下:

    1,CSV文件中有的列值是用双引号,有的列值则没有双引号:

    //img.jbzj.com/file_images/article/201605/https://www.lingkb.com/wp-content/uploads/2020/08/20200820020906-5f3ddb426088d.png

    如果再次运行上面的语句,得到结果就和上一个结果不同了:

    //img.jbzj.com/file_images/article/201605/https://www.lingkb.com/wp-content/uploads/2020/08/20200820020910-5f3ddb4687004.png

    其中有的列就包含双引号了,这应该不是我们想要的结果,要解决这个问题,我们只能利用临时表了,先把CSV导入到临时表中,然后在从这个临时表中导入到最终表的过程中把双引号去掉。

    2,CSV文件的列值全部是由双引号组成的:

    //img.jbzj.com/file_images/article/201605/https://www.lingkb.com/wp-content/uploads/2020/08/20200820020907-5f3ddb43404b4.png

    这个问题要比上一个稍微复杂点,除了要先把CSV文件导入到临时表中,还必须修改一下在把CSV文件导入到临时表的代码:

    //img.jbzj.com/file_images/article/201605/https://www.lingkb.com/wp-content/uploads/2020/08/20200820020908-5f3ddb4418b10.png

    注意圈中的部分。

    3,CSV文件的列要多于数据表的列:

    //img.jbzj.com/file_images/article/201605/https://www.lingkb.com/wp-content/uploads/2020/08/20200820020908-5f3ddb44eae0e.png

    而我们的数据表只有三列,如果在执行上面的导入代码,会产生什么结果呢?

    结果就是:

    //img.jbzj.com/file_images/article/201605/https://www.lingkb.com/wp-content/uploads/2020/08/20200820020909-5f3ddb45c1b84.png

    它把后边的全部放在了Area列中了,要处理这个问题,其实也很简单,就是我们把我们想要的列值在数据表中都按顺序建立一列,而把不需要的列值,也在数据表中建立一个,只不过只是一个临时列,在把这个数据表导入到最终表的时候,忽略这个临时列就行了。