SQL Server - 使用聚集索引时如何存储数据页

Question

Marin Mohanadas

Asked: 2016-05-25 07:27:07 +0800 CST2016-05-25 07:27:07 +0800 CST 2016-05-25 07:27:07 +0800 CST

SQL Server 中每个句子的每个单词的首字母仅大写

772

我只想将 SQL 列中每个句子的每个单词的第一个字母大写。

例如，如果句子是：

'我喜欢电影'

然后我需要输出：

《我喜欢电影》

询问：

declare @a varchar(15) 

set @a = 'qWeRtY kEyBoArD'

select @a as [Normal text],
upper(@a) as [Uppercase text],
lower(@a) as [Lowercase text],
upper(left(@a,1)) + lower(substring(@a,2,len(@a))) as [Capitalize first letter only]

在这里，我只在我的专栏中做了大写、小写和大写首字母（这里我只放了一个随机单词）。

这是我的结果：

有没有可能这样做？

在不使用用户定义函数的情况下是否有可能获得结果？

我需要输出Qwerty Keyboard

13 个回答

Voted

Mikael Eriksson · Answer 1 · 2016-05-25T07:50:29+08:00

Best Answer

Mikael Eriksson

2016-05-25T07:50:29+08:002016-05-25T07:50:29+08:00

declare @a varchar(30); 

set @a = 'qWeRtY kEyBoArD TEST<>&''"X';

select stuff((
       select ' '+upper(left(T3.V, 1))+lower(stuff(T3.V, 1, 1, ''))
       from (select cast(replace((select @a as '*' for xml path('')), ' ', '<X/>') as xml).query('.')) as T1(X)
         cross apply T1.X.nodes('text()') as T2(X)
         cross apply (select T2.X.value('.', 'varchar(30)')) as T3(V)
       for xml path(''), type
       ).value('text()[1]', 'varchar(30)'), 1, 1, '') as [Capitalize first letter only];

这首先通过用空标记替换所有空格将字符串转换为 XML <X/>。然后它使用nodes(). 为了让行恢复到一个值，它使用了这个for xml path技巧。

27

wBob · Answer 2 · 2016-05-26T07:37:16+08:00

wBob

2016-05-26T07:37:16+08:002016-05-26T07:37:16+08:00

在 SQL Server 2016 中，您可以使用 R 执行此操作，例如

-- R capitalisation code stolen from here:
-- http://stackoverflow.com/questions/6364783/capitalize-the-first-letter-of-both-words-in-a-two-word-string

EXEC sp_execute_external_script
    @language = N'R',
    @script = N'
simpleCap <- function(x) {
  s <- strsplit(x, " ")[[1]]
  paste(toupper(substring(s, 1,1)), substring(s, 2),
        sep="", collapse=" ")
}             

OutputDataSet <- as.data.frame((sapply(as.vector(InputDataSet$xtext), simpleCap)))',
    @input_data_1 = N'SELECT LOWER(testString) xtext FROM dbo.testStrings'
WITH RESULT SETS ( ( properCase VARCHAR(50) NOT NULL ) );

你是否应该是一个不同的问题:)

15

Chris J · Answer 3 · 2016-06-15T05:54:05+08:00

也许我很傻，但是检查了我针对提供的某些内容编写的以下查询，这似乎更有效（取决于索引）。

代码有点愚蠢，但没有人说如果它看起来很愚蠢但它有效，那么它并不愚蠢。

Begin

    Declare @text Varchar(30);

    Set @text = 'qWeRtY kEyBoArD TEST<>&''"X';

    Declare @1 Varchar(2)= ' a'
      , @2 Varchar(2)= ' b'
      , @3 Varchar(2)= ' c'
      , @4 Varchar(2)= ' d'
      , @5 Varchar(2)= ' e'
      , @6 Varchar(2)= ' f'
      , @7 Varchar(2)= ' g'
      , @8 Varchar(2)= ' h'
      , @9 Varchar(2)= ' i'
      , @10 Varchar(2)= ' j'
      , @11 Varchar(2)= ' k'
      , @12 Varchar(2)= ' l'
      , @13 Varchar(2)= ' m'
      , @14 Varchar(2)= ' n'
      , @15 Varchar(2)= ' o'
      , @16 Varchar(2)= ' p'
      , @17 Varchar(2)= ' q'
      , @18 Varchar(2)= ' r'
      , @19 Varchar(2)= ' s'
      , @20 Varchar(2)= ' t'
      , @21 Varchar(2)= ' u'
      , @22 Varchar(2)= ' v'
      , @23 Varchar(2)= ' w'
      , @24 Varchar(2)= ' x'
      , @25 Varchar(2)= ' y'
      , @26 Varchar(2)= ' z';

Set @text=' '+@text

    Select  LTrim(Replace(Replace(Replace(Replace(Replace(Replace(Replace(Replace(Replace(Replace(Replace(Replace(Replace(Replace(Replace(Replace(Replace(Replace(Replace(Replace(Replace(Replace(Replace(Replace(Replace(Replace(Lower(@text) ,
                                                              @1 , Upper(@1)) ,
                                                              @2 , Upper(@2)) ,
                                                              @3 , Upper(@3)) ,
                                                              @4 , Upper(@4)) ,
                                                              @5 , Upper(@5)) ,
                                                              @6 , Upper(@6)) ,
                                                              @7 , Upper(@7)) ,
                                                              @8 , Upper(@8)) ,
                                                              @9 , Upper(@9)) ,
                                                              @10 , Upper(@10)) ,
                                                              @11 , Upper(@11)) ,
                                                              @12 , Upper(@12)) ,
                                                              @13 , Upper(@13)) ,
                                                              @14 , Upper(@14)) ,
                                                              @15 , Upper(@15)) ,
                                                              @16 , Upper(@16)) ,
                                                              @17 , Upper(@17)) ,
                                                              @18 , Upper(@18)) ,
                                                              @19 , Upper(@19)) ,
                                                              @20 , Upper(@20)) ,
                                                            @21 , Upper(@21)) ,
                                                    @22 , Upper(@22)) , @23 ,
                                            Upper(@23)) , @24 , Upper(@24)) ,
                            @25 , Upper(@25)) , @26 , Upper(@26)));


end

Solomon Rutzky · Answer 4 · 2016-06-28T23:07:09+08:00

另一种选择是通过 SQLCLR 处理此问题。.NET 中甚至已经有一种方法可以执行此操作：TextInfo.ToTitleCase（in System.Globalization）。此方法将大写每个单词的第一个字母，并将剩余的字母小写。与这里的其他提议不同，它还跳过所有大写的单词，假设它们是首字母缩略词。当然，如果需要这种行为，也可以很容易地更新任何 T-SQL 建议来执行此操作。

.NET 方法的一个好处是它可以大写字母作为补充字符。例如：DESERET SMALL LETTER OW具有DESERET CAPITAL LETTER OW的大写映射 ^{（当我将它们粘贴到此处时，两者都显示为框）}，但该UPPER()函数不会将小写版本更改为大写，即使当当前数据库的默认排序规则设置为Latin1_General_100_CI_AS_SC. 这似乎与 MSDN 文档一致，该文档未列出使用Collation: Collation UPPERand Unicode Support: Supplementary Characters时行为不同的函数图表。LOWER_SC

SELECT N'DESERET SMALL LETTER OW' AS [Label], NCHAR(0xD801)+NCHAR(0xDC35) AS [Thing]
UNION ALL
SELECT N'DESERET CAPITAL LETTER OW' AS [Label], NCHAR(0xD801)+NCHAR(0xDC0D) AS [Thing]
UNION ALL
SELECT N'SmallButShouldBeCapital' AS [Label], UPPER(NCHAR(0xD801)+NCHAR(0xDC35)) AS [Thing]

返回（放大以便您可以实际看到补充字符）：

您可以使用 Unicode.org 上的以下搜索功能查看小写字符的完整（和当前）字符列表并更改为大写字符（您可以通过向下滚动来查看补充字符，直到您到达“DESERET”部分，或者只是点击Control-F并搜索该单词）：

http://unicode.org/cldr/utility/list-unicodeset.jsp?a=%5B%3AChanges_When_Titlecased%3DYes%3A%5D

虽然老实说，这并不是一个巨大的好处，因为任何人实际上都在使用任何可以标题的补充字符是值得怀疑的。无论哪种方式，这是 SQLCLR 代码：

using System.Data.SqlTypes;
using System.Globalization;
using Microsoft.SqlServer.Server;

public class TitleCasing
{
    [return: SqlFacet(MaxSize = 4000)]
    [Microsoft.SqlServer.Server.SqlFunction(IsDeterministic = true, IsPrecise = true)]
    public static SqlString TitleCase([SqlFacet(MaxSize = 4000)] SqlString InputString)
    {
        TextInfo _TxtInf = new CultureInfo(InputString.LCID).TextInfo;
        return new SqlString (_TxtInf.ToTitleCase(InputString.Value));
    }
}

这是@MikaelEriksson 的建议——稍作修改以处理NVARCHAR数据以及跳过全部大写的单词（以更接近地匹配 .NET 方法的行为）——以及对该 T-SQL 实现和SQLCLR 实现：

SET NOCOUNT ON;
DECLARE @a NVARCHAR(50);

SET @a = N'qWeRtY kEyBoArD TEST<>&''"X one&TWO '
         + NCHAR(0xD801)+NCHAR(0xDC28)
         + N'pPLe '
         + NCHAR(0x24D0) -- ⓐ  Circled "a"
         + NCHAR(0xFF24) -- Ｄ  Full-width "D"
         + N'D u'
         + NCHAR(0x0308) -- ̈  (combining diaeresis / umlaut)
         + N'vU'
         + NCHAR(0x0308) -- ̈  (combining diaeresis / umlaut)
         + N'lA';
SELECT @a AS [Original];

SELECT STUFF((
       SELECT N' '
              + IIF(UPPER(T3.V) <> T3.V COLLATE Latin1_General_100_BIN2, 
                    UPPER(LEFT(T3.V COLLATE Latin1_General_100_CI_AS_SC, 1))
                    + LOWER(STUFF(T3.V COLLATE Latin1_General_100_CI_AS_SC, 1, 1, N'')),
                    T3.V)
       FROM (SELECT CAST(REPLACE((SELECT @a AS N'*' FOR XML PATH('')), N' ', N'<X/>')
                    AS XML).query('.')) AS T1(X)
       CROSS APPLY T1.X.nodes('text()') AS T2(X)
       CROSS APPLY (SELECT T2.X.value('.', 'NVARCHAR(70)')) AS T3(V)
       FOR XML PATH(''), TYPE
       ).value('text()[1]', 'NVARCHAR(70)') COLLATE Latin1_General_100_CI_AS_SC, 1, 1, N'')
                AS [Capitalize first letter only];

SELECT dbo.TitleCase(@a) AS [ToTitleCase];

行为上的另一个区别是这个特定的 T-SQL 实现仅在空格上拆分，而该ToTitleCase()方法将大多数非字母视为单词分隔符（因此在处理“one&TWO”部分时存在差异）。

两种实现都正确处理组合序列。“üvÜlA”中的每个重音字母都由一个基本字母和一个组合分音符号/变音符号（每个字母上方的两个点）组成，并且在两个测试中它们都正确转换为另一种情况。

最后，SQLCLR 版本的一个意想不到的缺点是，在进行各种测试时，我在 .NET 代码中发现了一个与处理带圆圈字母相关的错误（现已在 Microsoft Connect 上报告——更新：Connect 已经移至/dev/null- 从字面上看 - 所以如果问题仍然存在，我可能需要重新提交）。.NET 库将带圆圈的字母视为单词分隔符，这就是它没有将“ⓐDDD”转换为“Ⓐddd”的原因。

供参考

TextInfo.ToTitleCase封装上述方法的预先完成的 SQLCLR 函数现在可以在SQL#（我编写的）的免费版本中作为String_ToTitleCase和String_ToTitleCase4k 获得。

?

Riley Major · Answer 5 · 2016-05-28T07:48:22+08:00

作为Mikael Eriksson 的答案的替代方案，您可以考虑在多行选择语句中使用专有的 T-SQL 处理变量设置。

在 SQL Server 中，当变量被设置为 SELECT 语句的一部分时，每一行都将执行设置逻辑的迭代。

人们经常使用这种方法来连接字符串，尽管它不受支持并且存在一些官方记录的问题。官方问题与特定的 ORDER BY 特征有关，我们在这里不需要，所以也许这是一个安全的选择。

在这里，我们遍历字母表中的 26 个字母，如果它们前面有空格，则将它们替换为大写版本。（我们最初通过将第一个字母大写并使其余字母小写来准备字符串，就像您在问题中所做的那样。）

SQL 有点复杂，因为它需要使用一个 Tally 表（一个数字表）来生成它正在执行的 26 次替换迭代。您可以制作一个方便的内联表值用户定义函数 (TVF) 来生成该数字表，或者您甚至可以使用物理表。

此选项的一个缺点是它不能成为内联 TVF 的一部分，因为它需要涉及设置变量。因此，如果您想将此方法应用于输出的列，则需要将其包装到多语句 TVF 或标量用户定义函数中。

但是，它的查询计划要简单得多，而且可能比 XML 方法快得多。您可能会争辩说它也更容易理解（特别是如果您有自己的计数表）。

DECLARE
    @a VARCHAR(15) = 'qWeRtY kEyBoArD';

SELECT
    @a = UPPER(LEFT(@a,1)) + LOWER(SUBSTRING(@a,2,LEN(@a)));

WITH TallyTableBase AS
(
    SELECT
        0 AS n
    FROM    (VALUES(0),(0),(0),(0),(0),(0),(0),(0),(0),(0)) AS t(n)
)
SELECT
    @a = REPLACE(@a, ' ' + CHAR(n.n), ' ' + CHAR(n.n))
FROM        (
                SELECT      TOP 26 ROW_NUMBER() OVER (ORDER BY (SELECT 1)) + 64 AS n
                FROM        TallyTableBase a
                CROSS JOIN  TallyTableBase b
            ) AS n;

SELECT
    @a AS [NewValue];

（我使用更大的字符串对此进行了测试，XML 解决方案大约为 6 毫秒，而 14 毫秒。）

此解决方案还有许多其他限制。如所写，它假定不区分大小写的排序规则，尽管您可以通过指定排序规则或在搜索词上运行 LCASE 来消除该问题，但会牺牲一些性能。它也只处理标准的 ASCII 字母并且依赖于它们在字符集中的位置，所以它不会对 ñ 做任何事情。

TLaV · Answer 6 · 2016-06-15T10:47:08+08:00

TLaV

2016-06-15T10:47:08+08:002016-06-15T10:47:08+08:00

假设您只想在空格后面大写单词，这是另一种方法。

DECLARE @String VARCHAR(1000)
SET @String = 'qWeRtY kEyBoArD tEst'

/*
Set the string to all lower case and
add a space at the beginning to ensure
the first letter gets capitalized
in the CTE
*/
SET @String = LOWER(' ' + @String)  

/*
Use a Tally "Table" as a means of
replacing the letter after the space
with the capitalize version of the
letter
*/
;WITH TallyTable
AS
(
    SELECT TOP 1000 ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) as N
    FROM master.sys.all_columns a CROSS JOIN master.sys.all_columns b

)
SELECT @String = REPLACE(@String,SUBSTRING(@String,CHARINDEX(' ',@String,N), 2),UPPER(SUBSTRING(@String,CHARINDEX(' ',@String,N), 2)))
FROM TallyTable
WHERE CHARINDEX(' ',@String,N) <> 0

--Remove the space added to the beginning of the string earlier
SET @String = RIGHT(@String,LEN(@String) - 1)

3

Simon Jones · Answer 7 · 2016-06-29T02:30:30+08:00

Simon Jones

2016-06-29T02:30:30+08:002016-06-29T02:30:30+08:00

可能不是防弹的，但我希望它对这个线程有帮助。

DECLARE @t VARCHAR(50) = 'the quick brown fox jumps over the lazy dog', @i INT = 0

DECLARE @chk VARCHAR(1)

WHILE @i <= LEN(@t)
BEGIN
    SELECT @chk=SUBSTRING(@t,@i,1)
        IF @chk = CHAR(32)
        BEGIN
            SET @t = STUFF(@t,@i+1,1,UPPER(SUBSTRING(@t,@i+1,1)))
        END
    SET @i=@i+1
END
PRINT @t

1

Jeffrey Elkins · Answer 8 · 2017-01-20T19:00:14+08:00

Jeffrey Elkins

2017-01-20T19:00:14+08:002017-01-20T19:00:14+08:00

下面是我在 Firebird 数据库中执行此操作的过程。可能可以清理很多，但它为我完成了工作。

set term ~;

Create Procedure EachWordCap

As

Declare Variable lcaption varchar(33);
Declare Variable lcurrentpos integer;
Declare Variable lstringlen integer;
begin
    for select ' ' || trim(lower(imagedata.imagename)) from imagedata
    where imagedata.imagename is not null and imagedata.imagename != ''
    into :lcaption
    do 
    begin
        lcurrentpos = 0;
        lstringlen = char_length(lcaption);
        while (lcurrentpos != 1) do
        begin
            lcurrentpos = position(' ', lcaption, iif(lcurrentpos = 0, 1,lcurrentpos)) + 1 ;
            lcaption = left(lcaption,lcurrentpos - 1) || upper(substring(lcaption from lcurrentpos for 1)) || right(lcaption,lstringlen - lcurrentpos);
        end
        --Put what you want to do with the text in here
    end
end~
set term ;~

0

Jerb · Answer 9 · 2017-07-28T01:48:47+08:00

Jerb

2017-07-28T01:48:47+08:002017-07-28T01:48:47+08:00

递归 CTE 非常适合这类事情。

对于大型操作可能不是特别有效，但确实允许在纯 SQL 选择语句中进行这种操作：

declare @a varchar(100) 

set @a = 'tHe qUiCk bRoWn FOX jumps   OvEr The lAZy dOG';

WITH [CTE] AS (
  SELECT CAST(upper(Left(@a,1)) + lower(substring(@a,2,len(@a))) AS VARCHAR(100)) AS TEXT,
         CHARINDEX(' ',@a) AS NEXT_SPACE
  UNION ALL
  SELECT CAST(Left(TEXT,NEXT_SPACE) + upper(SubString(TEXT,NEXT_SPACE+1,1)) + SubString(TEXT,NEXT_SPACE+2,1000) AS VARCHAR(100)),
         CHARINDEX(' ',TEXT, NEXT_SPACE+1)
  FROM [CTE]
  WHERE NEXT_SPACE <> 0
)

SELECT TEXT
FROM [CTE]
WHERE NEXT_SPACE = 0

输出：

The Quick Brown Fox Jumps   Over The Lazy Dog

0

Cristi · Answer 10 · 2019-02-22T02:21:15+08:00

Cristi

2019-02-22T02:21:15+08:002019-02-22T02:21:15+08:00

我喜欢这个版本。它很简单，并且可以用来创建一个函数，你只需要拥有正确的 SQL Server 版本：

WITH words
AS (
    SELECT upper(left(Value, 1)) + lower(substring(Value, 2, len(Value))) AS word
    FROM STRING_SPLIT('Lorem ipsum dolor sit amet.', ' ')
    )
SELECT STRING_AGG(words.word, ' ')
FROM words

0

SQL Server 中每个句子的每个单词的首字母仅大写

供参考

?

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

SQL Server 中每个句子的每个单词的首字母仅大写

13 个回答

供参考

?

相关问题