refactor: 优化数字字面量的语义分析与错误提示

- 重构了类型推断逻辑,支持更精确的类型判断
- 实现了智能的错误提示策略,根据不同情况给出具体建议
- 优化了范围校验逻辑,提高了代码的健壮性
- 改进了代码结构和注释,提高了可读性和可维护性
This commit is contained in:
Luke 2025-07-31 00:26:44 +08:00
parent 9a2b5d5e4e
commit 1293ac1f83

View File

@ -13,19 +13,42 @@ import org.jcnc.snow.compiler.semantic.type.Type;
import static org.jcnc.snow.compiler.semantic.type.BuiltinType.*;
/**
* {@code NumberLiteralAnalyzer} 用于对数字字面量表达式进行语义分析并推断其精确类型并支持类型范围校验与多错误收集
* <p>
* 类型推断规则如下
* <ol>
* <li>若字面量以类型后缀b/s/l/f/d大小写均可结尾则按后缀直接推断目标类型</li>
* <li>若无后缀且文本包含小数点或科学计数法'.' 'e/E'则推断为 double 类型</li>
* <li>否则推断为 int 类型</li>
* </ol>
* <p>
* 校验规则如下
* {@code NumberLiteralAnalyzer}
*
* <p>职责
* <ul>
* <li>按推断类型解析字符串若超出可表示范围或格式非法则向语义上下文添加 {@link SemanticError}不抛异常支持多错误收集和 IDE 友好提示</li>
* <li>所有建议信息风格统一指引用户用更大类型的后缀或类型声明最大类型提示为 double</li>
* <li>对数字字面量表达式进行语义分析并推断其精确类型</li>
* <li>按照推断类型进行范围校验</li>
* <li>发生越界时给出智能的错误提示与合理建议</li>
* </ul>
*
* <p>类型推断规则</p>
* <ol>
* <li>若字面量以类型后缀(b/s/l/f大小写均可)结尾则按后缀直接推断目标类型</li>
* <ul>
* <li>b byte</li>
* <li>s short</li>
* <li>l long</li>
* <li>f float</li>
* </ul>
* <li>若无后缀且文本包含小数点或科学计数法('.' 'e/E')则推断为 double(浮点默认 double不支持 d/D 后缀)</li>
* <li>否则推断为 int</li>
* </ol>
*
* <p>智能错误提示策略</p>
* <ul>
* <li>整数
* <ul>
* <li>int 放不下但 long 能放下 直接建议 long</li>
* <li> long 也放不下 一次性提示超出 int/long 可表示范围</li>
* </ul>
* </li>
* <li>浮点
* <ul>
* <li>float 放不下但 double 能放下 直接建议 double(无需 d 后缀)</li>
* <li> double 也放不下 一次性提示超出 float/double 可表示范围</li>
* </ul>
* </li>
* </ul>
*/
public class NumberLiteralAnalyzer implements ExpressionAnalyzer<NumberLiteralNode> {
@ -33,43 +56,43 @@ public class NumberLiteralAnalyzer implements ExpressionAnalyzer<NumberLiteralNo
/**
* 根据字面量后缀和文本内容推断类型
*
* @param hasSuffix 是否有类型后缀
* @param suffix 类型后缀字符
* @param digits 去除后缀的纯数字字符串
* @return 推断出的类型
* @param hasSuffix 是否存在类型后缀( b/s/l/f 有效)
* @param suffix 后缀字符(已转小写)
* @param digits 去掉下划线与后缀后的数字主体(可能含 . e/E)
* @return 推断类型(byte / short / int / long / float / double 之一)
*/
private static Type inferType(boolean hasSuffix, char suffix, String digits) {
if (hasSuffix) {
// 仅支持 b/s/l/f不支持 d/D(浮点默认 double)
return switch (suffix) {
case 'b' -> BYTE;
case 's' -> SHORT;
case 'l' -> BuiltinType.LONG;
case 'f' -> BuiltinType.FLOAT;
case 'd' -> BuiltinType.DOUBLE;
default -> INT;
default -> INT; // 其他后缀当作无效 int 处理(如需严格可改为抛/非法后缀)
};
}
if (digits.indexOf('.') >= 0 || digits.indexOf('e') >= 0 || digits.indexOf('E') >= 0) {
return BuiltinType.DOUBLE;
// 无后缀包含小数点或 e/E double否则 int
if (looksLikeFloat(digits)) {
return BuiltinType.DOUBLE; // 浮点默认 double
}
return INT;
}
/**
* 检查字面量数值是否在推断类型范围内超出范围则添加语义错误
* 做范围校验发生越界时写入智能的错误与建议
*
* @param ctx 语义分析上下文
* @param node 当前字面量节点
* @param raw 字面量原始字符串含后缀
* @param ctx 语义上下文(承载错误列表与日志)
* @param node 当前数字字面量节点
* @param inferred 推断类型
* @param digits 去除后缀的纯数字部分
* @param digits 规整后的数字主体(去下划线去后缀"123.""123.0")
*/
private static void validateRange(Context ctx,
NumberLiteralNode node,
String raw,
Type inferred,
String digits) {
try {
// 整数类型不允许出现浮点形式 //
if (inferred == BYTE) {
if (looksLikeFloat(digits)) throw new NumberFormatException(digits);
Byte.parseByte(digits);
@ -82,77 +105,224 @@ public class NumberLiteralAnalyzer implements ExpressionAnalyzer<NumberLiteralNo
} else if (inferred == BuiltinType.LONG) {
if (looksLikeFloat(digits)) throw new NumberFormatException(digits);
Long.parseLong(digits);
} else if (inferred == BuiltinType.FLOAT) {
}
// 浮点类型解析 + /下溢判断 //
else if (inferred == BuiltinType.FLOAT) {
float v = Float.parseFloat(digits);
if (Float.isInfinite(v)) throw new NumberFormatException(digits);
// 上溢Infinity下溢解析为 0.0 但文本并非全零
if (Float.isInfinite(v) || (v == 0.0f && isTextualZero(digits))) {
throw new NumberFormatException("float overflow/underflow: " + digits);
}
} else if (inferred == BuiltinType.DOUBLE) {
double v = Double.parseDouble(digits);
if (Double.isInfinite(v)) throw new NumberFormatException(digits);
if (Double.isInfinite(v) || (v == 0.0 && isTextualZero(digits))) {
throw new NumberFormatException("double overflow/underflow: " + digits);
}
}
} catch (NumberFormatException ex) {
String typeName = switch (inferred) {
case BYTE -> "byte";
case SHORT -> "short";
case INT -> "int";
case LONG -> "long";
case FLOAT -> "float";
case DOUBLE -> "double";
default -> inferred.toString();
};
String msg = getString(raw, digits, typeName);
// 智能的错误描述与建议(header 使用 digits避免带后缀)
String msg = getSmartSuggestionOneShot(digits, inferred);
ctx.getErrors().add(new SemanticError(node, msg));
ctx.log("错误: " + msg);
}
}
/**
* 根据类型名生成风格统一的溢出建议字符串
* 生成智能的错误提示与建议
*
* @param raw 字面量原始字符串
* @param digits 去除后缀的数字部分
* @param typeName 推断类型的名称
* @return 完整的错误描述
* <p>策略</p>
* <ul>
* <li>BYTE/SHORT/INT若能放进更大整型直接建议否则一次性提示已超出 int/long 范围</li>
* <li>LONG直接提示超出 long 可表示范围</li>
* <li>FLOAT double 能放下 建议 double否则一次性提示超出 float/double 可表示范围</li>
* <li>DOUBLE直接提示超出 double 可表示范围</li>
* </ul>
*
* @param digits 去后缀后的数字主体(用于 header 与建议示例)
* @param inferred 推断类型
* @return 完整错误消息(含建议)
*/
private static String getString(String raw, String digits, String typeName) {
String suggestion = switch (typeName) {
case "int" ->
"如需更大范围,请在数字末尾添加大写字母 'L'(如 " + digits + "L或将变量类型声明为 long。";
case "long" ->
"long 已为整数的最大类型,如需更大范围,请将变量类型声明为 double注意精度";
case "float" ->
"如需更大范围,请将变量类型声明为 double。";
case "byte" ->
"如需更大范围,请在数字末尾添加大写字母 'S'(如 " + digits + "S或将变量类型声明为 short、int 或 long。";
case "short" ->
"如需更大范围,请在数字末尾添加大写字母 'L'(如 " + digits + "L或将变量类型声明为 int 或 long。";
case "double" ->
"double 已为数值类型的最大范围,请缩小数值。";
default ->
"请调整字面量类型或范围。";
};
return "数值字面量越界: \"" + raw + "\" 超出 " + typeName + " 可表示范围。 " + suggestion;
private static String getSmartSuggestionOneShot(String digits, Type inferred) {
String header;
String suggestion;
switch (inferred) {
case BYTE -> {
long v;
try {
v = Long.parseLong(digits);
} catch (NumberFormatException e) {
// long 都放不下智能
header = composeHeader(digits, "超出 byte/short/int/long 可表示范围。");
return header;
}
if (v >= Short.MIN_VALUE && v <= Short.MAX_VALUE) {
header = composeHeader(digits, "超出 byte 可表示范围。");
suggestion = "建议将变量类型声明为 short并在数字末尾添加 's'(如 " + digits + "s)。";
} else if (v >= Integer.MIN_VALUE && v <= Integer.MAX_VALUE) {
header = composeHeader(digits, "超出 byte 可表示范围。");
suggestion = "建议将变量类型声明为 int(如 " + digits + ")。";
} else {
header = composeHeader(digits, "超出 byte 可表示范围。");
suggestion = "建议将变量类型声明为 long并在数字末尾添加 'L'(如 " + digits + "L)。";
}
return appendSuggestion(header, suggestion);
}
case SHORT -> {
long v;
try {
v = Long.parseLong(digits);
} catch (NumberFormatException e) {
header = composeHeader(digits, "超出 short/int/long 可表示范围。");
return header;
}
if (v >= Integer.MIN_VALUE && v <= Integer.MAX_VALUE) {
header = composeHeader(digits, "超出 short 可表示范围。");
suggestion = "建议将变量类型声明为 int(如 " + digits + ")。";
} else {
header = composeHeader(digits, "超出 short 可表示范围。");
suggestion = "建议将变量类型声明为 long并在数字末尾添加 'L'(如 " + digits + "L)。";
}
return appendSuggestion(header, suggestion);
}
case INT -> {
try {
// 尝试解析为 long若成功说明能进 long
Long.parseLong(digits);
} catch (NumberFormatException e) {
// long 都放不下智能
header = composeHeader(digits, "超出 int/long 可表示范围。");
return header;
}
// 能进 long直接建议 long
header = composeHeader(digits, "超出 int 可表示范围。");
suggestion = "建议将变量类型声明为 long并在数字末尾添加 'L'(如 " + digits + "L)。";
return appendSuggestion(header, suggestion);
}
case LONG -> {
// 已明确处于 long 分支且越界智能
header = composeHeader(digits, "超出 long 可表示范围。");
return header;
}
case FLOAT -> {
// float 放不下尝试 double若能放下则直接建议 double否则智能提示 float/double 都不行
boolean fitsDouble = fitsDouble(digits);
if (fitsDouble) {
header = composeHeader(digits, "超出 float 可表示范围。");
suggestion = "建议将变量类型声明为 double(如 " + digits + ")。"; // double 默认无需 d 后缀
return appendSuggestion(header, suggestion);
} else {
header = composeHeader(digits, "超出 float/double 可表示范围。");
return header;
}
}
case DOUBLE -> {
header = composeHeader(digits, "超出 double 可表示范围。");
return header;
}
default -> {
header = composeHeader(digits, "超出 " + inferred + " 可表示范围。");
return header;
}
}
}
/**
* 判断字符串是否为浮点数格式包含小数点或科学计数法
* 生成越界错误头部统一使用数字主体而非原始 raw(避免带后缀引起误导)
*
* @param s 数字部分字符串
* @return 是否为浮点格式
* @param digits 去后缀后的数字主体
* @param tail 错误尾部描述(超出 int 可表示范围)
*/
private static String composeHeader(String digits, String tail) {
return "数值字面量越界: \"" + digits + "\" " + tail;
}
/**
* 在头部后拼接建议文本(若存在)
*
* @param header 错误头部
* @param suggestion 建议文本(可能为 null)
*/
private static String appendSuggestion(String header, String suggestion) {
return suggestion == null ? header : header + " " + suggestion;
}
/**
* 文本层面判断是否看起来是浮点字面量
* 只要包含 '.' 'e/E'即视为浮点
*/
private static boolean looksLikeFloat(String s) {
return s.indexOf('.') >= 0 || s.indexOf('e') >= 0 || s.indexOf('E') >= 0;
}
/**
* 对数字字面量进行语义分析推断类型并进行溢出与格式校验
* 文本判断是否为零(不解析纯文本)
* 在遇到 e/E 之前若出现任意 '1'..'9'视为非零否则视为零
* 用于识别文本非零但解析结果为 0.0的下溢场景
* <p>
*
* "0.0" true
* "000" true
* "1e-9999" false(e 前有 '1'若解析为 0.0 则视为下溢)
* "0e-9999" true
*/
private static boolean isTextualZero(String s) {
if (s == null || s.isEmpty()) return false;
for (int i = 0; i < s.length(); i++) {
char c = s.charAt(i);
if (c == 'e' || c == 'E') break; // 指数部分不参与是否为零的判断
if (c >= '1' && c <= '9') return true;
}
return false;
}
/**
* 判断 double 是否能正常表示(不溢出也非文本非零但解析为 0.0的下溢)
*
* @param ctx 当前语义分析上下文可用于错误收集等
* @param mi 当前模块信息未使用
* @param fn 当前函数节点未使用
* @param locals 当前作用域的符号表未使用
* @param expr 数字字面量表达式节点
* @return 推断出的类型
* @param digits 去后缀后的数字主体
*/
private static boolean fitsDouble(String digits) {
try {
double d = Double.parseDouble(digits);
return !Double.isInfinite(d) && !(d == 0.0 && isTextualZero(digits));
} catch (NumberFormatException e) {
return false;
}
}
/**
* 规整数字串
* 仅移除末尾的类型后缀( b/s/l/f大小写均可不含 d/D)
*
* @param s 原始字面量字符串
* @return 规整后的数字主体
*/
private static String normalizeDigits(String s) {
if (s == null) return "";
String t = s.trim();
if (t.isEmpty()) return t;
// 仅移除末尾的类型后缀(b/s/l/f大小写均可)
char last = t.charAt(t.length() - 1);
if ("bBsSfFlL".indexOf(last) >= 0) {
t = t.substring(0, t.length() - 1).trim();
}
return t;
}
/**
* 入口对数字字面量进行语义分析
* <p>
* 分步
* <ol>
* <li>读取原始文本 raw</li>
* <li>识别是否带后缀( b/s/l/f)</li>
* <li>规整数字主体 digits(去下划线去后缀补小数点零)</li>
* <li>按规则推断目标类型</li>
* <li>做范围校验越界时记录智能的错误与建议</li>
* <li>返回推断类型</li>
* </ol>
*/
@Override
public Type analyze(Context ctx,
@ -161,27 +331,30 @@ public class NumberLiteralAnalyzer implements ExpressionAnalyzer<NumberLiteralNo
SymbolTable locals,
NumberLiteralNode expr) {
// 获取字面量原始文本 "123", "3.14", "2f"
// 1) 原始文本( "123", "3.14", "2f", "1_000_000L", "1e300")
String raw = expr.value();
if (raw == null || raw.isEmpty()) {
return INT;
return INT; // 空文本回退为 int(按需可改为错误)
}
// 判断并去除后缀
// 2) 是否带后缀( b/s/l/f不支持 d/D)
char lastChar = raw.charAt(raw.length() - 1);
char suffix = Character.toLowerCase(lastChar);
boolean hasSuffix = switch (suffix) {
case 'b', 's', 'l', 'f', 'd' -> true;
case 'b', 's', 'l', 'f' -> true;
default -> false;
};
String digits = hasSuffix ? raw.substring(0, raw.length() - 1) : raw;
// 推断类型
Type inferred = inferType(hasSuffix, suffix, digits);
// 3) 规整数字主体
String digitsNormalized = normalizeDigits(raw);
// 做范围校验发现溢出等问题直接加到 ctx 错误列表
validateRange(ctx, expr, raw, inferred, digits);
// 4) 推断类型
Type inferred = inferType(hasSuffix, suffix, digitsNormalized);
// 5) 范围校验(发生越界则收集智能的错误与建议)
validateRange(ctx, expr, inferred, digitsNormalized);
return inferred;
}
}