본문 바로가기
카테고리 없음

postgresql collation 日本語ソート

by yunexus 2024. 10. 5.

SQL

COLLATION作成

DROP COLLATION "jp-sort";
CREATE COLLATION "jp-sort" (provider = icu, locale = "ja-u-kn-true");

 

COLLATION検索

SELECT * 
FROM pg_collation
where collname like '%jp%';

 

COLLATIONを利用した検索

SELECT name
FROM user
WHERE name like '%テスト'
ORDER BY name COLLATE "jp-sort" ASC
limit 1000;

 

ソートテスト COLLATIONを利用したテスト

 _スペース:テスト
 _全角スペース:テスト
!_びっくり:テスト
@_アッドマーク:テスト
1_いち:テスト
1_イチ:テスト
01_ぜろいち:テスト
01_ゼロイチ:テスト
1テスト
2_に:テスト
2_ニ:テスト
9_きゅう:テスト
9_キュウ:テスト
10_じゅう:テスト
10_ジュウ:テスト
11_じゅういち:テスト
11_ジュウイチ:テスト
99_きゅうじゅうきゅう:テスト
99_キュウジュウキュウ:テスト
a_小エイ:テスト
A_大エイ:テスト
b_小ビ:テスト
B_大ビ:テスト
z_小ゼット:テスト
Z_大ゼット:テスト
あああああ:テスト
アアアアア:テスト
アアアアア:テスト
か:テスト
愛:テスト

 

関連資料

https://www.postgresql.org/docs/current/collation.html#ICU-COLLATION-LEVELS

 

23.2. Collation Support

23.2. Collation Support # 23.2.1. Concepts 23.2.2. Managing Collations 23.2.3. ICU Custom Collations The collation feature allows specifying the sort order …

www.postgresql.org

https://www.postgresql.jp/docs/12/collation.html

 

23.2. 照合順序サポート

23.2.2.3. 新しい照合順序オブジェクの作成 <!-- If the standard and predefined collations are not sufficient, users can create their own collation objects using the SQL command . --> 標準の定義済み照合順序が十分でない場合は

www.postgresql.jp

https://www.unicode.org/reports/tr35/tr35-collation.html

 

Unicode Locale Data Markup Language (LDML) Part 5: Collation

Unicode Technical Standard #35 Unicode Locale Data Markup Language (LDML)Part 5: Collation For the full header, summary, and status, see Part 1: Core. Summary This document describes parts of an XML format (vocabulary) for the exchange of structured locale

www.unicode.org

https://kikakurui.com/x4/X4061-1996-01.html

 

JISX4061:1996 日本語文字列照合順番

この規格は,日本語を主とする表記に用いられる文字列を含むレコードの照合順番を規定する。

kikakurui.com

https://www.unicode.org/reports/tr41/#UTS10

 

UAX #41: Common References for UAXs

Unicode® Standard Annex #41 Common References for Unicode Standard Annexes Summary This annex presents a common set of references for the Unicode Standard Annexes. Status <!-- NOT YET APPROVED This is a draft document which may be updated, replaced, or su

www.unicode.org

 

https://blog.query1000.com/archives/46219676.html

 

【第986回】漢字のソート順とよみがなについて : イジハピ!

先週の金曜の第985回と同じような話になる。

blog.query1000.com

https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q14146371914

 

漢字の昇順の法則について教えて下さい。同じ読みで違う漢字の名前などをエクセルの昇順の

漢字の昇順の法則について教えて下さい。同じ読みで違う漢字の名前などをエクセルの昇順の並べ替えはどういう法則で順番を決めているのでしょうか? 例:阿部→安部、坂井→酒井など画

detail.chiebukuro.yahoo.co.jp

http://www.infonet.co.jp/ueyama/ip/binary/x0208txt.html

 

JIS漢字コード表

JIS 漢字コード表 (JIS X 0208)

www.infonet.co.jp