debug_standardize_address — 返回一个 JSON 格式的文本,列出了解析的标记和标准化结果
text debug_standardize_address(
text lextab, text gaztab, text rultab, text micro, text macro=NULL)
;
这是一个用于调试地址标准化规则和词法/地理映射的函数。它返回一个 JSON 格式的文本,其中包含匹配的规则、标记的映射以及使用 词法表表名、地理表和规则表表名以及地址的输入地址的最佳标准化 stdaddr 形式。
对于单行地址,只需使用 micro
对于双行地址,A micro
由标准的邮政地址第一行组成,例如 门牌号 街道
,而 macro 由标准的邮政地址第二行组成,例如 城市, 州 邮政编码 国家
。
JSON 文档中返回的元素有
input_tokens
对于输入地址中的每个词,返回该词的位置、词的标记分类以及它映射到的标准词。请注意,对于某些输入词,您可能会得到多个记录,因为某些输入可以被分类为多个类别。
rules
匹配输入的规则集以及每个规则的相应得分。第一个规则(得分最高)是用于标准化的规则
stdaddr
当运行 standardize_address 时将返回的标准化地址元素 stdaddr
可用性: 3.4.0
此方法需要 address_standardizer 扩展。
使用 address_standardizer_data_us 扩展
CREATE EXTENSION address_standardizer_data_us; -- only needs to be done once
变体 1:单行地址并返回输入标记
SELECT it->>'pos' AS position, it->>'word' AS word, it->>'stdword' AS standardized_word, it->>'token' AS token, it->>'token-code' AS token_code FROM jsonb( debug_standardize_address('us_lex', 'us_gaz', 'us_rules', 'One Devonshire Place, PH 301, Boston, MA 02109') ) AS s, jsonb_array_elements(s->'input_tokens') AS it;
position | word | standardized_word | token | token_code ----------+------------+-------------------+--------+------------ 0 | ONE | 1 | NUMBER | 0 0 | ONE | 1 | WORD | 1 1 | DEVONSHIRE | DEVONSHIRE | WORD | 1 2 | PLACE | PLACE | TYPE | 2 3 | PH | PATH | TYPE | 2 3 | PH | PENTHOUSE | UNITT | 17 4 | 301 | 301 | NUMBER | 0 (7 rows)
变体 2:多行地址并返回第一个规则的输入映射和得分
SELECT (s->'rules'->0->>'score')::numeric AS score, it->>'pos' AS position, it->>'input-word' AS word, it->>'input-token' AS input_token, it->>'mapped-word' AS standardized_word, it->>'output-token' AS output_token FROM jsonb( debug_standardize_address('us_lex', 'us_gaz', 'us_rules', 'One Devonshire Place, PH 301', 'Boston, MA 02109') ) AS s, jsonb_array_elements(s->'rules'->0->'rule_tokens') AS it;
score | position | word | input_token | standardized_word | output_token ----------+----------+------------+-------------+-------------------+-------------- 0.876250 | 0 | ONE | NUMBER | 1 | HOUSE 0.876250 | 1 | DEVONSHIRE | WORD | DEVONSHIRE | STREET 0.876250 | 2 | PLACE | TYPE | PLACE | SUFTYP 0.876250 | 3 | PH | UNITT | PENTHOUSE | UNITT 0.876250 | 4 | 301 | NUMBER | 301 | UNITT (5 rows)